字节编码中文编码方式总结

时间紧张,先记一笔,后续优化与完善。

    

    ASCII-----单字节编码

    

    

    GB2312-----中国人的简体字编码

    

    

    GBK----中国人的简繁编码

    

    GBK编码(Chinese Internal Code Specification)是中国大陆订制的、等同于UCS的新的中文编码展扩国家标准。gbk编码可以用来同时表现

    繁体字

    和简体字,而gb2312只能表现简体字,gbk是兼容gb2312编码的。

    GBK 采用了

    单双字节合混

    的式方。

    它兼容ASCII,因些0x~07F 分部的义定和ASCII 一样。对其他符字,G

    BK中个每汉字仍然包括两个字节,第一个字节的范围是0x81-0xFE(即129-254)-----最高位必须是 1

    每日一道理
成功的花朵开放在啊勤劳的枝头,失败的苦果孕育在懒惰的温床之中。

    ,第二个字节的范围是0x40-0xFE(即64-254)。

    2.如果字节范围 0x80~0xFF,即

    最高位为 1 

    时,还要需再取下一个字节,两个字节合起来才表现一个符字。

    

    Unicode----一统码、万国码,java、python

    

    

    UTF-8-----国际编码,通用性好,前缀码,从第一个字节能就道知这是个几字节字

    

    U+

    0

    800 - U+

    F

    FFF         1110 

    ****

     10** **** 10** ****(0xE

    0

    ~0xE

    F

    )        字节最高四位是 1110, 则这是三字节编码,用于其他符字,如中文简繁等 

文章结束给大家分享下程序员的一些笑话语录: 联想——对内高价,补贴对外倾销的伟大“民族”企业。

原文地址:https://www.cnblogs.com/xinyuyuanm/p/3045552.html