计算机编码方式

首先需要弄明白一件事，计算机只能识别0，1，因此字符什么的需要编码进行存储，同样将这些0和1序列表达的意思读取出来，需要进行译码。

计算机是由老外发明的，他们可没有什么汉字，只有ABCD....，所以呢，最早的编码是ASCII编码，最开始是给128个字符进行编码。但这显然是不行的啊，世界上除了英语，还有那么多其他语言，因此ASCII码显然不适合这种情况（并且还需要解决输入法的问题，当然在这里并不讨论输入法。）。于是又有了Unicode编码方式，俗称万国码，可以存储好几万个字符。但是又有新的问题出现了，Unicode码不适合存储啊，因为Unicode是定长编码，非常浪费存储空间，这里又有了一种新的编码方式：utf-8。utf-8继承了unicode码，采用的是不定长编码，大大节约了存储空间。在数据存储和传输方面非常方便。

当然还有像gbk专门针对中文的编码方式，Shift_JIS针对日文的编码方式.....................

总之，编码方式很多，但在计算机内存中的编码方式一定是unicode编码，因为操作系统不可能内置好几十种编码方式，而是在内存中采用unicode编码，这样的话从其他编码方式解码成unicode码这一过程就可以让其他程序开发者来完成。

以下图为例：

一个文本文档的读取和保存到磁盘的过程如上图所示。