文件的基础

文件的基础

文件 

存储在外部介质上的数据或信息的集合 。 

程序中的源程序 

数据中保存着数据 

图像中的像素数据 

… 

有序的数据序列。 

 

编码 

信息从一种形式转换为另一种形式的过程 

ASCII码 

Unicode 

UTF-8 

… 

 

常用的编码

Unicode 

跨语言、跨平台进行文本转换和处理 

对每种语言中字符设定统一且唯一的二进制编码 

每个字符两个字节长 

65536 个字符的编码空间 

“严”:Unicode的十六进制数为4E25 

UTF-8编码 

可变长度的Unicode的实现方式 

“严”:十六进制数为E4B8A5  

GBK编码 

双字节编码 

举例 

 

文件数据 

文本文件 

以ASCII码方式存储的文件… 

二进制文件 

 

多行文本 

 表示换行 

举例:

Hello

World

 

Goodbye 32

Hello World Goodbye 32  

存储在文件中,得到字符序列: 

二进制文件ASCII码 

照片、音乐、视频、计算机程序等 

优点: 

更加节省空间 

采用二进制无格式存储 

表示更为精确 

注意: 

文本文件是基于字符定长的ASCII; 

二进制文件编码是变长的,灵活利用率要高; 

不同的二进制文件解码方式是不同的。 

 

原文地址:https://www.cnblogs.com/aze-003/p/5127927.html