8.字符编码

字符编码:就是我们现实世界与计算机之间的换算规则

ASCII字符编码 采用一个字节编码,主要针对英文编码
'a' 97
'A' 65
'0' 48


ISO-8859-1 又称Latin-1是国际化标志组织,ISO指定的,主要是为了西欧语言中的字符编码,和ASCII字符编码兼容
GB2312/GBK/GB18030 主要是汉子编码,三种编码从容量上看是包含关系
Unicode Unicode 统一了世界上所有的文字编码,Unicode 有几种实现UTF-8,UTF-16,UTF-32

为什么会出现乱码?
是因为你采用的编码方式和解码方式不同。

java采用的是Unicode 码


关于char类型:

关于char类型
char是字符类型,java中采用Unicode编码
底层占两个字节

char类型涉及到字符编码方式,
1)字符编码方式是现实世界中的文字和计算机的表示方式的转化规则
2)常见的字符编码方式有:ASCII,ISO-8859-1,GB2312<GBK<GB18030,Unicode UTF-8,UTF-16,UTF-32
3)字符如果采用的编码和解码方式不一致的话,会出现乱码


public class CharTest01{
public static void main(String[] args){
char c1='a';
char c2='中';//汉子占用2个字节,所以java中的char可以存储一个汉子
  }
}

原文地址:https://www.cnblogs.com/yyh8/p/6655145.html