Python-字符编码-Unicode UTF-8

什么是字符编码?

  --世界上有很多国家,每个国家都有自己独特的语言,所以在计算机普及的当今世界,

    每个国家都有自己的字符编码,本国的软件运行在其他国家的机器上,会出现乱码,

    有utf-8,gbk等各种编码格式,出现乱象,软件无法跨国界运行

如何解决乱码?

  -- 产生了万国码unicode,统一每个文字占用2个字节。

  -- utf-8相当于unicode扩展集,英文按照ascii码中占用1个字节,中文占用3个字节

  -- gbk编码,windows默认编码,不支持utf-8

字符之间如何转换?

  -- 通过unicode作为中间桥梁,可以转换各个国家的字符编码。

  --无论哪个国家的编码,只要机器支持unicode,就可以通过decode转换成unicode,然后通过encode转换成各国的字符编码

原文地址:https://www.cnblogs.com/2bjiujiu/p/6668424.html