计算机编码方式

 

首先需要弄明白一件事,计算机只能识别0,1,因此字符什么的需要编码进行存储,同样将这些0和1序列表达的意思读取出来,需要进行译码。

 

计算机是由老外发明的,他们可没有什么汉字 ,只有ABCD....,所以呢,最早的编码是ASCII编码,最开始是给128个字符进行编码。但这显然是不行的啊,世界上除了英语,还有那么多其他语言,因此ASCII码显然不适合这种情况(并且还需要解决输入法的问题,当然在这里并不讨论输入法。)。于是又有了Unicode编码方式,俗称万国码,可以存储好几万个字符。但是又有新的问题出现了,Unicode码不适合存储啊,因为Unicode是定长编码,非常浪费存储空间,这里又有了一种新的编码方式:utf-8。utf-8继承了unicode码,采用的是不定长编码,大大节约了存储空间。在数据存储和传输方面非常方便。

当然还有像gbk专门针对中文的编码方式,Shift_JIS针对日文的编码方式.....................

 

总之,编码方式很多,但在计算机内存中的编码方式一定是unicode编码,因为操作系统不可能内置好几十种编码方式,而是在内存中采用unicode编码,这样的话从其他编码方式解码成unicode码这一过程就可以让其他程序开发者来完成。

以下图为例:

一个文本文档的读取和保存到磁盘的过程如上图所示。

原文地址:https://www.cnblogs.com/mlgjb/p/8000700.html