字符编码

字符编码

  1.什么是字符编码

    字符编码表;人类的字符《======》数字

    1Bytes=8bit

    1B=8b    一个字节等于8个二进制

    ASCII码:只能识别英文字符,一个英文字符=8bit

    GBK:能识别汉字于英文,1汉字=16bit,1英文字符=8bit

    Shift_JIS日语编码

    Eur_kr 韩语编码

    unicode:能够识别万国字符,1字符=2Bytes=16bit

      两大特点:

        1,能够兼容万国字符

        2,与各个国家的字符编码都有映射关系

    utf_8:是Unicode的转换格式,1个英文字符=1Bytes    1个汉字=3bytes

重点:

1,编码与解码:

  字符-----编码---》Unicode的二进制------编码----》GBK的二进

  GRB 的二进制---解码----》Unicode的二进制---解码   ----字符

2,解决乱码问题的核心法则:

     字符用什么编码格式编码,就应该用什么编码格式进行解码

3,python解释器默认的字符编码

  python2:ASCII

  python:utf_8

  通过文件头可以修改python解释器默认使用的字符编码

  在文件首行写:#coding:文件当初存的时候用的字符编码

为何人类要编码

  人类与计算机打交道用的 都是人类的字符,而计算机无法识别人类的字符,只能识别二进制,所以必须将人类的字符编码成计算机能识别的二进制数字

如何用字符编码

    

原文地址:https://www.cnblogs.com/frank007/p/9682685.html