打开文件进行读取时,需要显式指定要用于读取文件的编码:
Reader r = new InputStreamReader(new FileInputStream("myfile"), StandardCharsets.UTF_8);这样,默认平台编码(您可以使用更改
-Dfile.encoding)的值不再重要。
注意:
我通常建议 始终 为依赖于标准语言环境的任何操作(例如字符I / O)显式指定编码。许多Java
API方法默认使用平台编码,我认为这是一个不好的设计,因为平台编码通常不是正确的,而且它可能会突然改变(如果用户(例如,用户切换了操作系统区域设置)),从而破坏了您的应用程序。
因此,只需始终说出您想要哪种编码即可。
在某些情况下,平台编码是正确的(例如,在打开用户刚刚为您创建的文件时),但是这种情况很少见。
笔记2:
java.nio.charset.StandardCharsets是Java
1.7中引入的。对于较旧的Java版本,您需要将输入编码指定为String(ugh)。可能的编码列表取决于JVM,但是保证每个JVM至少具有:
US-ASCII,ISO-8859-1,UTF-8,UTF-16BE,UTF-16LE,UTF-16。



