如果您的文件位于
cp1252和中
utf-8,则有一种简单的方法。
import loggingdef force_depre(string, precs=['utf8', 'cp1252']): for i in precs: try: return string.depre(i) except UnipreDepreError: pass logging.warn("cannot depre url %s" % ([string]))for item in os.listdir(rootPath): #Convert to Unipre if isinstance(item, str): item = force_depre(item) print item否则,有一个字符集检测库。
Python-检测字符集并转换为utf-8
https://pypi.python.org/pypi/chardet



