您的文件开头包含UTF-8 BOM。
要摆脱它,首先将文件内容解码为unipre。
fp = open("file.txt")data = fp.read().depre("utf-8-sig").enpre("utf-8")但是最好不要将其编码回
utf-8,而是使用
unipred文本。有一个好的规则:尽快将所有输入文本数据解码为unipre,并且只能与unipre一起使用;并尽可能晚地将输出数据编码为所需的编码。这将使您免于很多头痛。
要以某种编码读取较大的文件,请使用
io.open或
precs.open。
还要检查一下。
使用
str.strip()或
str.rstrip()除去换行符
n。



