Java将中文转换成unicode字符。

先贴出处吧http://ljhzzyx.blog.163.com/blog/static/38380312201037102843515/

在看Java国际化程序的实现。从最基础的建立不同国家的属性文件开始吧。

中文:你好!

英语:Hello!

法语:Bonjour!

在属性文件定义时必须按照“名称_国家代码”的形式命名(),即所以属性文件的名称必须一样,只有国家代码不一样。

怎么获取不同国家的ISO编码呢?

1.可以直接去搜索

2.如果觉得麻烦也可以直接在IE浏览器中查看各个国家的编码,因为IE浏览器可以适应各个国家的语言要求。具体步骤(IE9浏览器):"Internet选项",在打开对话框中选择“常规”选项卡,单击"语言"按钮,再单击"添加"按钮,就会出现各个国家的编码。

下面说说中文装unicode的方法吧。

在jdk的bin目录下有个转换工具:native2ascii,运行native2ascii加要转换的内容则可转换成unicode码,

带参数运行:native2ascii -reverse,则可从unicode码转成原有字符。

写好属性文件message_zh_CN.properties。为求简便,将其放置在bin目录下

执行 native2ascii message_zh_CN.properties 123.txt

打开123.txt就可以看到转换好的文件。

再看看代码实现吧。

/**
* 中文到unicode编码的转换
*/
public class UnicodeTest {

public static void main(String[] args) {
    String cn = "怀念外婆屋后的柚子树";
    System.out.println(cnToUnicode(cn));
    // 字符串 : u5f00u59cbu4efbu52a1 ,由于  在java里是转义字符,要写出下面这种形式
    String unicode = "\u5f00\u59cb\u4efb\u52a1";
    System.out.println(unicodeToCn(unicode));
}

private static String unicodeToCn(String unicode) {
    /** 以  u 分割,因为java注释也能识别unicode,因此中间加了一个空格*/
    String[] strs = unicode.split("\\u");
    String returnStr = "";
    // 由于unicode字符串以  u 开头,因此分割出的第一个字符是""。
    for (int i = 1; i < strs.length; i++) {
      returnStr += (char) Integer.valueOf(strs[i], 16).intValue();
    }
    return returnStr;
}

private static String cnToUnicode(String cn) {
    char[] chars = cn.toCharArray();
    String returnStr = "";
    for (int i = 0; i < chars.length; i++) {
      returnStr += "\u" + Integer.toString(chars[i], 16);
    }
    return returnStr;
}

}

  

原文地址:https://www.cnblogs.com/wangfantasy/p/3592148.html