栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

具体字符使用UTF-8编码集存储的举例 [Java]

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

具体字符使用UTF-8编码集存储的举例 [Java]

具体字符使用UTF-8存储的举例
  1. 首先我们要知道"尚"字的Unicode编码值为 : 23578(十进制)

  2. 对应为二进制: 0101 1100 0001 1010

  3. 那么具体到UTF -8中的编码是怎样的?

  4. 我们要明白 – 这个时候的"尚"是一个中文字符 – 而中文字符在UTF-8中是通过三个字节进行存储的

  5. UTF-8编码集中的三个字节的存储格式为: 1110xxxx 10xxxxxx 10xxxxxx

    • 我们可以发现这个时候x一共有16个,刚刚够填充我们的"尚"字在Unicode中的编码的二进制(也是16位)
  6. 那么我们将"尚"字在Unicode中存储的二进制的16位数据填充到UTF-8编码集中三个字节的存储格式中,就得到了"尚"字在UTF-8中的存储编码 : 11100101 10110000 10011010

    • ​ 1110xxxx 10xxxxxx 10xxxxxx
    • ​ +
    • ​ 0101 110000 011010
    • ​ =
    • 结果为: 11100101 1011000 10011010
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/692433.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号