Python3中默认的字符编码是Unicode编码,和文件的编码无关
即使是在文件前面加上#-*-coding:gbk-*-也默认为Unicode,这就是创建字符串的时候不能进行decode的原因,因为decode为转成Unicode编码,原来就是Unicode编码就无法进行转换了。
import sys print(sys.getdefaultencoding()) ->utf-8
将字符串装换成gbk模式
s = '你好'
s_to_gbk = s.encode('gbk')
print(s_to_gbk) ->b'xc4xe3xbaxc3'
然后再decode(字符格式),这里的字符格式为字符当前的格式,即告诉Python应该以什么类型去解码
s = '你好'
s_to_gbk = s.encode('gbk')
print(s_to_gbk) ->b'xc4xe3xbaxc3'
gbk_to_utf8 = s_to_gbk.decode('gbk')
print(gbk_to_utf8) ->你好
在将该Unicode类型的字符串转换成GB2312
s = '你好'
s_to_gbk = s.encode('gbk')
print(s_to_gbk) ->b'xc4xe3xbaxc3'
gbk_to_utf8 = s_to_gbk.decode('gbk')
print(gbk_to_utf8) ->你好
utf8_to_gb2312 = gbk_to_utf8.encode('gb2312')
print(utf8_to_gb2312)->b'xc4xe3xbaxc3'
encode(字符格式)这里的字符格式为想要转成的字符格式
如果想显示就要进行decode成Unicode编码,这样就可以在Python中显示汉字了
print(utf8_to_gb2312.encode('gb2312'))->你好



