栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

使用Python 3的readlines()进行Unicode错误处理

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用Python 3的readlines()进行Unicode错误处理

在Python 3中,在创建文件对象时传递一个适当的

errors=
值(例如
errors=ignore
errors=replace
)(假定它是-
的子类;
io.TextIOWrapper
如果不是,请考虑将其包装在一个对象中!);另外,请考虑传递比
charmap
(可能不确定,
utf-8
始终是一个好的起点)更可能的编码。

例如:

f = open('misc-notes.txt', encoding='utf-8', errors='ignore')

在Python
2中,该

read()
操作仅返回字节;然后,诀窍是将它们解码以将它们放入字符串中(实际上,如果需要,则需要字符而不是字节)。如果您对它们的真实编码没有更好的猜测:

your_string.depre('utf-8', 'replace')

…替换未处理的字符,或

your_string.depre('utf-8', 'ignore')

简单地忽略它们。

也就是说,查找并使用其 实际 编码(而不是猜测

utf-8
)将是首选。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/626310.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号