怎么使用java判断一个字符串是属于什么编码？

从csv文件获得中文，但是获得的这个中文死活是乱码，不能与数据库中的数据进行比较，现在就想知道这个字段是什么编码格式的，然后将它转换为GBK，不知道各位大神有什么方法不？
前面不用看了哈，那个是背景，关键是怎么判断一个字符串的编码格式？谢谢了，能解决问题，重重的赏哈，嘿嘿

举报该问题

推荐答案 æ¨èäº2016-09-03

ç¨æ³å¾ç®å

/*------------------------------------------------------------------------
detectoræ¯æ¢æµå¨ï¼å®ææ¢æµä»»å¡äº¤ç»å·ä½çæ¢æµå®ç°ç±»çå®ä¾å®æã
cpDetectoråç½®äºä¸äºå¸¸ç¨çæ¢æµå®ç°ç±»ï¼è¿äºæ¢æµå®ç°ç±»çå®ä¾å¯ä»¥éè¿addæ¹æ³
å è¿æ¥ï¼å¦ParsingDetectorã JChardetFacadeãASCIIDetectorãUnicodeDetectorã
detectoræç§âè°æåè¿åéç©ºçæ¢æµç»æï¼å°±ä»¥è¯¥ç»æä¸ºåâçååè¿åæ¢æµå°ç
åç¬¦éç¼ç ã
--------------------------------------------------------------------------*/
CodepageDetectorProxy detector =   CodepageDetectorProxy.getInstance();
/*-------------------------------------------------------------------------
ParsingDetectorå¯ç¨äºæ£æ¥HTMLãXMLçæä»¶æåç¬¦æµçç¼ç ,æé æ¹æ³ä¸çåæ°ç¨äº
æç¤ºæ¯å¦æ¾ç¤ºæ¢æµè¿ç¨çè¯¦ç»ä¿¡æ¯ï¼ä¸ºfalseä¸æ¾ç¤ºã
---------------------------------------------------------------------------*/
detector.add(new ParsingDetector(false));
/*--------------------------------------------------------------------------
JChardetFacadeå°è£äºç±Mozillaç»ç»æä¾çJChardetï¼å®å¯ä»¥å®æå¤§å¤æ°æä»¶çç¼ç
æµå®ãæä»¥ï¼ä¸è¬æäºè¿ä¸ªæ¢æµå¨å°±å¯æ»¡è¶³å¤§å¤æ°é¡¹ç®çè¦æ±ï¼å¦æä½ è¿ä¸æ¾å¿ï¼å¯ä»¥
åå¤å å ä¸ªæ¢æµå¨ï¼æ¯å¦ä¸é¢çASCIIDetectorãUnicodeDetectorçã
---------------------------------------------------------------------------*/
detector.add(JChardetFacade.getInstance());
//ASCIIDetectorç¨äºASCIIç¼ç æµå®
detector.add(ASCIIDetector.getInstance());
//UnicodeDetectorç¨äºUnicodeå®¶æç¼ç çæµå®
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charset charset = null;
File f=new File("E://specialCar//test.csv");
try {
      charset = detector.detectCodepage(new BufferedInputStream(new FileInputStream(f)),100);
} catch (Exception ex) {ex.printStackTrace();}
if(charset!=null){
     System.out.println(f.getName()+"ç¼ç æ¯ï¼"+charset.name());
}else{
    System.out.println(f.getName()+"æªç¥");
}

éçº³å

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/Wjj7zXzOtBe7OzvteB.html

其他回答

第1个回答 2014-08-27

//判断当前字符串的编码格式
if(destination.equals(new String(destination.getBytes("iso8859-1"), "iso8859-1")))
{
　　destination=new String(destination.getBytes("iso8859-1"),"utf-8");
}本回答被网友采纳

第2个回答 2014-08-27

通一段文字来获取他的编码是非常困难的

参考:http://blog.csdn.net/caesar525/article/details/2070844
http://bbs.csdn.net/topics/320220507
http://www.iteye.com/topic/465073

第3个回答 2014-08-27

当前jdk没有专门的方法，
我是这样判断处理的，比较笨拙，需要多次判断，关键部分如下
if(str.equals(new String(srt.getBytes("iso8859-1"), "iso8859-1"))) //判断
{
str=new String(destination.getBytes("iso8859-1"),"utf-8"); //转成要求的编码
}追问

这样，那不是要每一种编码都要判断一下？

追答

我是那么处理的，把常用的都判断了的。
你可以抽象一下，弄个专门的方法出来。

第4个回答 2014-08-27

http://blog.csdn.net/ge_zhiqiang/article/details/8211378追问

这个方法太伤身体了

1 2 下一页

相似回答

技术问题:java中如何判断字符串内容是否是一种编码格式答：可以看下java.nio.charset.Charset这个类，这个类里面有个静态方法：public static boolean isSupported(String charsetName)通知是否支持指定的 charset。参数：charsetName - 请求的 charset 名称；可能是规范名称或别名返回：当且仅当当前 Java 虚拟机支持指定的 charset 时才返回 true 抛出：IllegalCharsetN...

技术问题:java中如何判断字符串内容是否是编码答：如果是Java的String对象的话，则一定是Unicode的，这个没有为什么，Java就是这么定的。我猜你的问题应该是如何判断一段字节流是什么编码类型，对吗？比如一个文件，或是网络上面取下来的一段Byte数组，你需要用一个合适的编码来解析成字符串。这个让你失望了，没有一个文档化的，确定的方法来判断，只能...

怎么知道 java字符串 编码格式答：这样的测试方法是不正确的。getBytes(charset)是解码，new String(byte[], charset)是编码。new String(str.getBytes(charset),charset)是解码再编码，无论charset是什么编码格式，返回的字符串内容原始str是一致，因此equals方法都是返回true，达不到测试字符串编码格式的目的。个人观点：正确的测试姿势应该...

java可供判断某字符串是什么编码的一行代码答：//判断当前字符串的编码格式 if(destination.equals(new String(destination.getBytes("iso8859-1"), "iso8859-1"))){ destination=new String(destination.getBytes("iso8859-1"),"utf-8");} 刚学习java的人，对于java中方法request.getParameter(“”)，返回值若是中文，有时会莫名其妙的值变成了...

java中怎么判断一个字符串的编码?答：明确告诉你，没有办法，你必须先知道编码，才能把byte数组转成字符，如果已经是java的String那么只有unicode编码一种。

java 判断字符串什么编码类型答：如果是Java的String对象的话，则一定是Unicode的，这个没有为什么，Java就是这么定的。我猜你的问题应该是如何判断一段字节流是什么编码类型，对吗？比如一个文件，或是网络上面取下来的一段Byte数组，你需要用一个合适的编码来解析成字符串。这个让你失望了，没有一个文档化的，确定的方法来判断，只能...

Java中如何查看字符串是什么字符集答：判断java字符串的字符集有多种方法，我们一一讨论如下：1、通过把未知编码字符串,用猜想的编码再解码,观察字符串是不是正确还原了。原理:假如目标编码没有数组中的字符,那么编码会破坏,无法还原。缺点:假如字符少,而正巧错误的猜想编码中有这种字节,就会出错。如:new String("tested str".getBytes("...

如何判断一个字符串是java代码还是英文单词答：Java中判断字符串的编码有两种思路：一种是根据byte的长度判断，英文的字母数字好标点符号都是一个byte，且值在0-255之间另一种是根据中文的Unicode取值范围判断，这个就是把所以的范围都包含，才能判断正确，参考unicode中文范围：示例代码：import java.util.regex.Matcher;import java.util.regex.Pattern...

JAVA如何判断一个字符的ASCII码答：我用.codePointAt(1)>65来判断字符串的第一个字符的ASCII码是否大于65,但是运行结果却不对,那JAVA到底怎样才能判断一个字符的ASCII码呢?...我用.codePointAt(1)>65来判断字符串的第一个字符的ASCII码是否大于65,但是运行结果却不对,那JAVA到底怎样才能判断一个字符的ASCII码呢?

大家正在搜

java字符串包含另一个字符串 java字符串包含某个字符串 java如何判断字符串是数字 java判断是否包含字符串 java判断字符串是否为空 java判断字符串空 java比较字符串是否一样 java判断回文字符串 java比较两个字符串是否相等