栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

使用java从乱码文本中解析出正确的文本

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用java从乱码文本中解析出正确的文本

这是一个可以从乱码文本中得到正确的原始文本的程序,其基于的原理在于错误的编码往往导致位补充,因此正确的文本使用的字节数应该是最少的(之一)。


复制代码 代码如下:
package com.hongyuan.test;

import java.io.UnsupportedEncodingException;


public class CharSetTest {

 public static final String[] CHARSET_NAMES=new String[]{"ISO8859-1","GBK","UTF-8"};

 public static void main(String[] args) throws UnsupportedEncodingException {
  //乱码字符串
  String str="寰蒋鐧惧害鍏辨帹Windows XP鑱斿悎闃叉姢瑙e喅鏂规";

  int strLength=Integer.MAX_VALUE; //字符长度
  String newStr="";     //从乱码字符串分析出的字符串
  String srcCharSet="";    //当前乱码字符串编码
  String targetCharSet="";   //乱码字符串正确的编码

  //遍历可能的编码组合,从中造成编码长度最小的编码格式
  for(int i=0;i   for(int j=0;j    String temp=new String(str.getBytes(CHARSET_NAMES[i]),CHARSET_NAMES[j]);
    //System.out.println(temp);
    if(temp.length()<=strLength){
     strLength=temp.length();
     newStr=temp;
     srcCharSet=CHARSET_NAMES[i];
     targetCharSet=CHARSET_NAMES[j];
    }
   }
  }
  //输出查询到的编码及正确文本格式
  System.out.println(srcCharSet+"-->"+targetCharSet+":"+newStr);
 }

}

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/152275.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号