栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Java控制台输出的默认字符编码

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Java控制台输出的默认字符编码

我假设您的控制台仍在cmd.exe下运行。我怀疑您的控制台真的希望使用UTF-8-我希望它真的是OEM
DOS编码(例如850或437)。

Java将在JVM初始化期间使用默认编码集对字节进行编码。

在我的电脑上复制:

java Foo

Java编码为Windows-1252;控制台解码为IBM850。结果: Mojibake

java -Dfile.encoding=UTF-8 Foo

Java编码为UTF-8;控制台解码为IBM850。结果: Mojibake

cat test.txt

cat将文件解码为UTF-8;cat编码为IBM850;控制台解码为IBM850。

java Foo | cat

Java编码为Windows-1252;cat解码为Windows-1252;cat编码为IBM850;控制台解码为IBM850

java -Dfile.encoding=UTF-8 Foo | cat

Java编码为UTF-8;cat解码为UTF-8;cat编码为IBM850;控制台解码为IBM850

cat的
此实现必须使用启发式方法来确定字符数据是否为UTF-8,然后将数据从UTF-8或ANSI(例如Windows-1252)转码为控制台编码(例如IBM850)。

可以使用以下命令确认:

$ java HexDump utf8.txt78 78 c3 a4 c3 b1 78 78$ cat utf8.txtxxäñxx$ java HexDump ansi.txt78 78 e4 f1 78 78$ cat ansi.txtxxäñxx

命令可以做出此决定,因为

e4 f1
不是有效的UTF-8序列。

您可以通过以下方法更正Java输出:

  • 将控制台编码设置为系统ANSI值
  • 使用控制台类型
  • 使用一些希夫层,你与这样 的猫

HexDump 是一个简单的Java应用程序:

import java.io.*;class HexDump {  public static void main(String[] args) throws IOException {    try (InputStream in = new FileInputStream(args[0])) {      int r;      while((r = in.read()) != -1) {        System.out.format("%02x ", 0xFF & r);      }      System.out.println();    }  }}


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/449764.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号