ASCII、Unicode和UTF-8编码的区别；中英文混合截取

ASCII编码是128个字符

中国把汉字编入GB2312，Shift_JIS/Euc-kr各国标准.....

Unicode是为了解决各国乱码的，但浪费存储空间

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6字节，英文字母是1字节，汉字通常是3字节，生僻字符是4-6字节

txt文本文档为什么有时打开是一堆乱码？

1：编码方式由ASCII码和Unicode码
其中Unicode码包括UTF-8,UTF-16,UTF-32三种,其中UTF-8是变长码，
由于解码错误，导致了打开错误
你可以使用RTF（写字板）或者Word等软件打开 
2：源文件根本就不是文本文件，有些人出于保密或者网络传输方便（有些网络传输对格式有明确限制，所以需要修改扩展名）把源文件的扩展名改成了txt 
扩展名：文件名中最后的一个“.”之后的名字，用来表明文件类型，帮助设置默认程序