ISO/IEC 9899:2011 条款5——5.1.1 翻译环境

5.1.1 翻译环境

5.1.1.1程序结构

1、一个C程序不需要一次全被翻译完。程序的文本被保存在本国际标准中被称作为源文件（或预处理文件）的单元里。一个源文件连同所有通过指示符#include所包含的头文件以及源文件一起被称作为一个预处理翻译单元。在预处理之后，一个预处理单元被称作为一个翻译单元。先前被翻译的翻译单元可以被独立地保存或保存在库里。一个程序的各个翻译单元通过（比如）对函数（其标识符具有外部连接）的调用、对对象（其标识符具有外部连接）的操作，或是对数据文件的操作进行通信。翻译单元可以被独立翻译，然后稍后被连接来产生一个可执行程序。

5.1.1.2 翻译阶段

1、在翻译的语法规则之前的操作由以下阶段指定［注：实现应该将其行为视作为这些各个阶段都发生，即使其中很多在实践上会被合拢在一起。源文件、翻译单元以及已被翻译的翻译单元不需要以文件方式被存储，也不需要在这些实体与任一外部表示之间有任何一对一的相应关系。本描述仅仅是概念上的，并且并不指定任一特定实现。］

1. 物理源文件多字节字符以一个实现自定义的方式被映射到源字符集（对于行结束指示符引入换行字符），如果有必要的话。三字符序列被相应单字符的内部表示所取代。

2. 所有紧挨在一个换行字符之前的一个倒斜杠字符（）都会被删除，将物理源行粘接起来形成逻辑源行。只有在任一物理源行最后的倒斜杠才有资格成为这么一个粘接部分。一个不空的源文件应该以一个换行符结尾，并且在此换行符前不应该出现倒斜杠。

3. 源文件被分解为若干预处理符记（token）［注：正如在6.4小节中描述的，将一个源文件的字符划分为若干预处理符记的过程是依赖上下文的。比如，见在一个#include预处理指示符内的<的处理］以及空白字符（包括注释）序列。一个源文件不应该以部分预处理符记或在一个部分注释中结束。每个注释用一个空格字符取代。换行字符被保留。每个除了换行之外的其它空白字符的非空序列是否被保留，还是用一个空格字符代替，由实现定义。

4. 预处理指示符被执行，宏调用被扩展，并且_Pragma单目操作符表达式被执行。如果一个字符序列匹配一个通用字符名的语法，它通过符记连接产生（6.10.3.3），那么该行为是为定义的。一个#include预处理指示符使得命名头文件或源文件从阶段1到阶段4递归处理。随后所有预处理指示符被删除。

5. 在字符常量以及字符串字面量［译者注：字面量定义请见：http://baike.baidu.com/link?url=3AhwRNJT4qo8OvAG1rKlzugWvUR2D3vTb0_eKQI-OOpPbND9mvS19qf_n_kz7DB92l6zLAoMmfspeJY9gSHBKK］中的每个源字符集成员和转义序列都被转换为执行字符集中相应的成员；如果没有相应的成员，那么它被转换为由实现自定义的一个非空（宽）字符成员。［注：一个实现不需要将所有非相应源字符转换为同一个执行字符。］

6. 相邻的字符串字面量符记被拼接。

7. 分隔符记的空白字符不再重要。每个预处理符记被转换为一个符记。转换后的符记在语法上以及语义上进行分析，然后作为一个翻译单元被翻译。

8. 所有外部对象以及函数引用被解决。库部分被连接以满足对没定义在当前翻译单元中的函数与对象的外部引用。所有这样的翻译输出被合成一个程序镜像，它含有在其执行环境中执行所需要的信息。

5.1.1.3 诊断

1、如果一个预处理翻译单元或翻译单元含有任一对语法规则或强制规定的违背，那么一个顺应标准的实现应该至少产生一个诊断消息（以一个实现定义的方式所标识），即使该行为也被显式地指定为未定义或实现定义的。诊断消息不需要在其它情况下产生。［注：此目的为，一个实现应该标识每个违反行为的本质以及可能位置发生在哪里。当然，一个实现不需要产生诊断信息，只要一个有效程序仍然被正确翻译。这也可以成功地翻译一个无效程序。］

2、例：一个实现应该为以下翻译单元发布一个诊断信息：

char i;
int i;

因为在这些情况下，在本国际标准中对一个构造为一个强制规定错误以及导致一个未定义行为所描述的行为，此强制规定错误应该被诊断。