简短的答案:
它为您提供了从中的指定索引开始的Unipre代码点
String。即该位置上字符的“
unipre号”。
更长的答案: Java是在16位(又名a
char)足以容纳任何存在的Unipre字符时创建的(这些部分现在被称为Basic
Multilingual
Plane或BMP)。后来,Unipre扩展为包括代码点>
2 16的字符。这意味着a
char不能再容纳所有可能的Unipre代码点。
解决方案是UTF-16:它以16位(即正好一个
char)存储“旧”
Unipre代码点,并以32位(即两个
char值)存储所有新的Unipre代码点。这两个16位值称为“代理对”。现在严格来说,a
char拥有“
UTF-16代码单元”,而不是以前的“ Unipre字符”。
现在
char,只要您不使用任何“新”
Unipre字符(或不太在乎它们),就可以使用所有“旧”方法(仅用于处理),但是如果您关心新的字符(或仅需要完全的Unipre支持),那么您将需要使用
实际上 支持所有可能的Unipre代码点的“代码点”版本。
注意:
Emojis是不在BMP中的unipre字符的一个众所周知的示例(即,仅在使用prepoint变体时才有效)是Emojis:即使是简单的Grinning
Face



