ASCII、Unicode和UTF-8编码的区别;中英文混合截取

ASCII编码是128个字符

中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准.....

Unicode是为了解决各国乱码的,但浪费存储空间

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6字节,英文字母是1字节,汉字通常是3字节,生僻字符是4-6字节

  

txt文本文档为什么有时打开是一堆乱码?

1:编码方式由ASCII码和Unicode码
其中Unicode码包括UTF-8,UTF-16,UTF-32三种,其中UTF-8是变长码,
由于解码错误,导致了打开错误
你可以使用RTF(写字板)或者Word等软件打开
2:源文件根本就不是文本文件,有些人出于保密或者网络传输方便(有些网络传输对格式有明确限制,所以需要修改扩展名)把源文件的扩展名改成了txt
扩展名:文件名中最后的一个“.”之后的名字,用来表明文件类型,帮助设置默认程序
原文地址:https://www.cnblogs.com/zuochanzi/p/7376464.html