《流畅的python》第四章 文本和字节序列

U1. 把码位转换成字节序列的过程是编码(encode),把字节序列转换成码位的过程是解码(decode)。

2. bytes和bytearray对象的各个元素是介于0--255之间的整数。

3. 结构体和内存视图:struct模块能处理bytes,bytearray和memoryview对象。 

4. 在解码时,会出现unicodedecodeerror(把二进制序列转化为字符串),unicodeencodeerror(把字符串转化为二进制序列)和syntaxerror三种错误。

error=ignore忽略无法处理的字符,error=replace把无法编码的字符替换为?,xmlcharrefreplace把无法编码的字符替换为XML实体。

5.Unicode三明治是最佳的处理文本文件。

原文地址:https://www.cnblogs.com/chengchengaqin/p/9530601.html