try: string.depre('utf-8') print "string is UTF-8, length %d bytes" % len(string)except UnipreError: print "string is not UTF-8"在Python
2中,
str是字节
unipre序列和字符序列。您可以
str.depre将字节序列解码为
unipre,并将
unipre.enpre字符序列编码为
str。因此,例如,
u"é"包含单个字符U
+ 00E9的unipre字符串也可以被写入
u"xe9";编码为UTF-8可得到字节序列
"xc3xa9"。
在Python 3中,这已更改;
bytes是一个字节序列,
str是一个字符序列。



