除了在各处使用unipre字符串并立即解码收到的任何编码字符串外,没有其他方法可以使unipre“正常工作”。问题在于,无论是处理编码数据还是未编码数据,还是使用为您跟踪数据的工具,您都必须始终保持直截了当。
Python
2所做的事情对此有问题:它使
str“默认值”而不是
unipre诸如字符串文字之类的东西,当您将两者相加时,它会默默地强制
str执行
unipre,并允许您调用
.enpre()已编码的字符串进行双重编码它。结果,有很多python编码器和python库不知道它们设计要使用哪种编码,但是仍然设计为处理
某些 特定的编码,因为该
str类型旨在让程序员进行管理编码本身。而且每次使用这些库时都必须考虑编码,因为它们
unipre本身不支持类型。
在您的特定情况下,第一个错误告诉您正在处理已编码的UTF-8数据,并尝试对其进行双重编码,而第二个错误则告诉您正在处理未编码的数据。它 看起来
像你可能有两个。您应该真正找到并解决问题的根源(我怀疑这与我上面提到的沉默的强制性有关),但这是一个可以在短期内解决此问题的技巧:
enpred_title = titleif isinstance(enpred_title, unipre): enpred_title = title.enpre('utf-8')如果实际上这是在无声地胁迫您的情况下发生,那么您应该可以使用出色的unipre-
nazi工具轻松找到问题所在:
python -Werror -muniprenazi myprog.py
这将使您在Unipre泄漏到您的非Unipre字符串时立即进行追溯,而不是尝试从实际问题的途中对该异常进行故障排除。有关详细信息,请参见我对这个相关问题的回答。



