没有。
例如:
控制字符(例如ESC,CR,NL等)不会被删除。这些在Unipre中具有不同的代码点。
空格,制表符等的序列未合并
不删除任意连字符(http://www.fileformat.info/info/unipre/char/00AD/index.htm)字符。
Unipre组合字符(https://en.wikipedia.org/wiki/Combining_character)未组合。
现在,其中一些是否可能是 “人类会发现有意义的实际角色” 尚有待商but……但总体答案仍然是“否”。
您进行了如下澄清:
我会以为“人类”的意思是“程序员”,我想像大多数程序员会将 r n视为两个字符…
比这更复杂。我是一名程序员,对我而言,这取决于上下文是否
rn有意义。如果我正在阅读README文件,则我的大脑会将空白中的差异视为没有语义重要性。但是,如果我正在编写解析器,则我的代码将考虑空格…取决于要解析的语言。



