实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 面试经验 > 面试问答

Python str与unicode类型

面试问答更新时间：2026-06-04 07:35:18 发布时间：1629天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

unipre

用于处理文本。文本是一个 代码点 序列， 可能大于一个字节 。文本可以被编码
在一个特定的编码来表示文本作为原始字节（例如

utf-8

，

latin-1

…）。

注意，这

unipre

是没有编码的 ！python使用的内部表示形式是实现细节，只要它能够表示所需的代码点，您就不必在意它。

相反，

str

在Python 2中是字节的简单序列。它不代表文字！

您可以将其

unipre

视为某些文本的一般表示形式，可以用多种不同方式将其编码为通过表示的二进制数据序列

str

。

注意：在Python 3中，

unipre

已重命名为，
str
并且
bytes
为普通字节序列提供了一种新类型。

您可以看到一些差异：

>>> len(u'à')  # a single pre point1>>> len('à')   # by default utf-8 -> takes two bytes2>>> len(u'à'.enpre('utf-8'))2>>> len(u'à'.enpre('latin1'))  # in latin1 it takes one byte1>>> print u'à'.enpre('utf-8')  # terminal encoding is utf-8à>>> print u'à'.enpre('latin1') # it cannot understand the latin1 byte�

请注意，使用时，

str

可以对特定编码表示形式的单个字节进行较低级别的控制，而使用时

unipre

，只能在代码点级别进行控制。例如，您可以执行以下操作：

>>> 'àèìòù''xc3xa0xc3xa8xc3xacxc3xb2xc3xb9'>>> print 'àèìòù'.replace('xa8', '')à�ìòù

以前是有效的UTF-8，现在已经不复存在了。使用unipre字符串，您不能以结果字符串不是有效的unipre文本的方式进行操作。您可以删除代码点，将代码点替换为其他代码点等，但不能与内部表示混淆。

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/668611.html

上一篇在numpy中创建外部产品数组

下一篇在OR Tools pywrapcp中遇到DLL错误

面试问答相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号