在混乱的某个地方,HTML模板(s)中的不间断空格被编码为ISO-8859-1,因此它们错误地显示为“”字符
那将被编码为UTF-8,而不是ISO-8859-1。不间断空格字符是ISO-8859-1中的字节0xA0;当编码为UTF-8时,它将为0xC2,0xA0,如果(错误地)将其视为ISO-8859-1,则显示为
"Â"。其中包括您可能不会注意到的结尾nbsp。如果该字节不存在,则说明您的文档有其他缺陷,我们需要进一步查看以找出问题所在。
什么是正则表达式,模板如何工作?如果将您的
字符串(正确)转换为U + 00A0 NON-BREAKING
SPACE字符,则似乎在某个地方包含了适当的HTML解析器。如果是这样,您可以只在DOM中本地处理模板,并要求它使用ASCII编码进行序列化以保留非ASCII字符作为字符引用。这也将使您不必再对HTML本身进行正则表达式后处理,而HTML本身一直是一项高度狡猾的业务。
好吧,无论如何,现在您可以将以下内容之一添加到文档中
<head>,看看它是否可以在浏览器中正确显示:
- 对于HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
- 对于HTML5:
<meta charset="utf-8">
如果您这样做了,那么剩下的问题就是ActivePDF的问题。



