记录一些特殊字符

名称 unicode编码 描述
全角空格 u{3000} 输出为整数 12288 trim时不会过滤
LF: 换行(Line Feed) u{a} 输出为整数 10
CR: 回车(Carriage Return) u{d} 输出为整数 13

苹果系统下换行符是 ,其content.trimmingCharacters(in: CharacterSet.whitespacesAndNewlines) 方法不会过滤 。

3F 字符编码时,如果该编码方式的字符集中没有该字符,当把编码后的字节数据16位输出时, 就会显示为一排排的3F,参见 文本的编码方式整理

FEFF UTF-8+BOM 中的BOM,用于标识bigEndian还是littleEndian,文本编码时如果带bom,可以轻松识别它是不是utf-8,utf-16,utf-32。
vs 新建的文件默认不带bom的,因为+BOM有时会引起平台间数据解析的问题。

assii码表中0~31及127(共33个)是控制字符或通信专用字符,是非可打印字符,向网页传输时,如果不对它们进行转义会导致浏览器json解析失败,一般采用unicode编码,则页面显示时不需要解码。正常表单编辑一般碰不到这类字符,但如果内容是从word文件中导入或其他类似操作,则可能碰到这钟问题。

原文地址:https://www.cnblogs.com/wj033/p/6354165.html