python编码

1.  ASCII编码:(AmericanStandard Code for Information Interchange,ASCII)

美国信息交换标准代码,是一种用于信息交换的美国标准代码,它的作用是给英文字母、数字、标点、字符转换成计算机能识别的二进制数

ord('a') chr(97) 相互转换

Ascii表:

数字范围为:48—57

大写字母范围为:65—90

小写字母范围为:97—122

2.GB2312编码:适用于汉字处理、汉字通信等系统之间的信息交换。

3.GBK编码:是汉字编码标准之一,是在GB2312-80 标准基础上的内码扩展规范,使用了双字节编码。

4.ANSI编码:是与你使用的windows操作系统的语言有关系的,像windows 7 简体中文版就是GBK(用一个字节表示英文,用两个字节表示一个中文)。

5.Unicode编码:

这是一种世界上所有字符的编码,但是它没有规定的存储方式。

Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。

现代操作系统和大多数编程语言都直接支持Unicode。

print unichr(30000)

print unichr(30001)

6.UTF-8编码:(Unicode Transformation Format - 8 bit)

UTF-8 是 Unicode 的一种实现方式。它是可变长的编码方式,可以使用 1~4 个字节表示一个字符,可根据不同的符号而变化字节长度。

7.Utf-8和GBK(GB2312)之间都必须通过Unicode才能转换

GBK、GB2312----Unicode----UTF-8

UTF-8----Unicode----GBK、GB2312

原文地址:https://www.cnblogs.com/wxjly/p/7728651.html