您的PDF文件没有可打印的空格字符,只是将单词放置在需要的位置。您可能需要做一些额外的工作来找出空格,可能是假设多字符运行是单词,然后在它们之间放置空格。
如果您可以在PDF阅读器中选择文本,并正确显示空格,那么至少您知道有足够的信息来重构文本。
“ fi”是印刷的连字,显示为单个字符。您可能会发现“ fl”,“ ffi”和“ ffl”也会发生这种情况。您可以使用字符串替换将“ fi”替换为连字。

您的PDF文件没有可打印的空格字符,只是将单词放置在需要的位置。您可能需要做一些额外的工作来找出空格,可能是假设多字符运行是单词,然后在它们之间放置空格。
如果您可以在PDF阅读器中选择文本,并正确显示空格,那么至少您知道有足够的信息来重构文本。
“ fi”是印刷的连字,显示为单个字符。您可能会发现“ fl”,“ ffi”和“ ffl”也会发生这种情况。您可以使用字符串替换将“ fi”替换为连字。