浅谈编码

  • ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字⺟的⼀套电脑编码系统,主要⽤于显示现代英语和其他⻄欧语⾔,其最多只能⽤ 8 位bit来表示(⼀个字节Byte),即:2**8=256,所以,ASCII码最多只能表示 256 个符号。

    • GBK, 国标码占⽤2个字节. 对应ASCII码GBK直接兼容. 因为计算机底层是⽤英⽂写的. 你不⽀持英⽂肯定不⾏. ⽽英⽂已经使⽤了ASCII码. 所以GBK要兼容ASCII.

    • Unicode,万国码,英文占2个字节,中文占4个字节

    • UTF-8: 每个字符最少占8位. 每个字符占⽤的字节数不定.根据⽂字内容进⾏具体编码. 是⽬前使⽤频率最⾼的⼀种编码。英文占1个字节,欧洲文字占2个字节,亚洲文字占3个字节。

    • 单位转换

      8bit = 1Byte
      1024Byte = 1KB
      1024KB = 1MB
      1024MB = 1GB
      1024GB = 1TB

原文地址:https://www.cnblogs.com/zyyhxbs/p/10976312.html