您似乎混淆了编码。看来您真正想要的
u'Andrxe9'是等效于
'André'。
但是您似乎是被错误解码的UTF-8编码。您可以通过将unipre字符串转换为普通字符串来解决此问题。我不确定最好的方法是什么,但这似乎可行:
>>> ''.join(chr(ord(c)) for c in u'Andrxc3xa9')'Andrxc3xa9'
然后正确解码:
>>> ''.join(chr(ord(c)) for c in u'Andrxc3xa9').depre('utf8')u'Andrxe9'现在它的格式正确。
但是,除了这样做,如果可能的话,您应该尝试弄清楚为什么数据首先被错误地编码,然后在那里解决该问题。



