字符串与编码

为什么需要编码呢?

       因为计算机只能处理数字,而不能处理字符和字符串,所以要将字符用十进制数字来表示,然后转换成二进制供计算机计算。

此处介绍字节(Byte) 和位(bit)的概念:

  计算机的最小存储单位为位,存储一位二进制数0或者1。而我们不用位来作为计算机中信息含义的最小单位是因为位常常不能表示一个相对完整的信息(但一位可用来表示特征位),

于是我们采用字节来表示信息含义的最小单位,扩大位的范围。1B = 8bit, 有256种0,1组合,就可以表示256种不同含义的事物,比如字符。

  ASCLL 编码就是用一个字节来表示大小写字母和常用字符的表示方式。

  编码就是实现计算机处理复杂信息的方式。

几种常见的编码 方式:

  UTF-8:  国际通用的编码方式, 一个英文字符用一个字节(8bit)编码,一个汉字用三个字节(24bit)编码。

  GBK:   国家标准编码,单个字符,不论中英文都用两个字节(16bit)编码。

  UTF-8 与 GBK 之间的相互转换需通过 Unicode 实现。

  

  

  

原文地址:https://www.cnblogs.com/yangwu-183/p/9881687.html