让我们恢复情况:
- InputStream传送字节
- *阅读器以某种编码传递字符
- 新的InputStreamReader(inputStream)使用操作系统编码
- 新的InputStreamReader(inputStream,“ UTF-8”)使用给定的编码(此处为UTF-8)
因此,在阅读之前需要知道编码。您首先使用字符集检测类正确完成了所有操作。
阅读http://pre.google.com/p/juniversalchardet/时,它应该处理UTF-8和UTF-16。您可以使用编辑器JEdit来验证编码,并查看是否存在问题。



