我有一个txt文档,我使用pdfminer从PDF转换而来。它有一个摘要部分,通常是一页长的PDF。问题是我可以找到单词摘要没有问题使用:
with open('output.txt',encoding="utf-8") as f:
if 'Summarization' in f.read():
print("true")
但我还是坚持了下来。我不知道怎样才能读到这段话写完。
PDF中的段落如下所示:PDF汇总部分
它在txt中看起来是这样的:我从中创建了:txt Summ Part
如果我能得到任何帮助,我会很高兴的。非常感谢。
您可以读取直到空行:
with open('output.txt',encoding="utf-8") as f:
if 'Summarization' in f.read():
print("true")
if f.read().strip() == '':
print('It's new paragraph')