- 写代码:代码文件存储在硬盘上,pycharm写代码默认是UTF-8形式
- 运行代码:代码会从硬盘加载到内存,如果是Python2默认会以ASCII形式加载进内存(如果有编码声明,则按声明的编码方式加载进内存),如果是Python3会以Unicode形式加载进内存
因为Python2会转为ASCII码,所以写中文时要添加格式声明
#coding:utf-8 a = '你好' print (a)
如果声明为GBK格式则会输出???,暂时无法识别为汉字
#coding:gb2312 a = '你好' print (a)
另一种声明方式:u的意思是以Unicode形式(理解为码位,并不属于真正的编码)把字符内容加载进内存
a = u'你好' print (a)
由上可知使用print打印时,当内容为ASCII或UTF-8编码,显示对应字符
str类型是以bytes方式存储,Unicode类型就是以Unicode方式存储
a = b'xe4xbdxa0xe5xa5xbd' print (a)
b会使编译器将其后面的内容理解为bytes形式读取进内存
a = 'hello'
print (a.encode('ascii'))#编码
c = b'xe4xbdxa0xe5xa5xbd'
print(c.decode('utf-8'))#解码
使用print打印时,当内容为Unicode,显示对应字符
str类型:Unicode方式存储
bytes类型:bytes方式存储



