看起来您拥有的是要逐行解释的大量文本数据。
您可以使用StringIO类将该内容包装为可搜索的类似文件的对象:
>>> import StringIO>>> content = 'bignuglyncontentsnofnmultiplenpdf files'>>> buf = StringIO.StringIO(content)>>> buf.readline()'bign'>>> buf.readline()'uglyn'>>> buf.readline()'contentsn'>>> buf.readline()'ofn'>>> buf.readline()'multiplen'>>> buf.readline()'pdf files'>>> buf.seek(0)>>> buf.readline()'bign'
对于您的情况,请执行以下操作:
from StringIO import StringIO# Read each line of the PDFpdfContent = StringIO(getPDFContent("test.pdf").enpre("ascii", "ignore"))for line in pdfContent: doSomething(line.strip())


