栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python day7: 字符编码*

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python day7: 字符编码*

字符编码

二进制

--->ASCII :只能存英文和拉丁字符。一个字符占一个字节,8位

------>gb2312 :只有6700多个中文, 1980

--------->gbk1.0 :存了两万多个字符, 1995

------------>gb18030 :2000, 27000中文

------------>unicode :utf-32:一个字符占4个字符

--------->unicode :utf-16:一个字符占2个字符以上,最多65535最多

--------->unicode :utf-8:一个英文用ASCII存,一个中文占三个字节

python 2 里面

默认ASCII码,所以没有申明使用别的解码方法,例如

# -*- coding: utf-8 -*-

则识别不出来中文,因为ASCII只有拉丁字符

这个时候就需要转码了,通过转成unicode

即:

ASCII——encode(编码)——》unicode——decode(解码)——》GBK

python 3 里面

默认是utf-8

a='''
好好味
'''
a1=a.encode('utf-8')

print(a1)

输出结果为

b'nxe5xa5xbdxe5xa5xbdxe5x91xb3n'

开头的b代表byte,即一种字节类型

encode在编码的同时,会把数据转成bytes类型

像中文这种ascii码里面没有的特殊字符,转码的时候是用多个ascii码内字符表示的,而英文就没有这一情况,因为英文本身就在ascii码中。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/840178.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号