编译器架构Compiler Architecture(下)

编译器架构Compiler Architecture(下)

Combining Scanning and Parsing

实际上没有必要将扫描(词法分析/标记化)与解析(语法分析/树生成)分开。基于PEGs的系统,比如Ohm,实际上是无扫描的:它们以一种预测的方式执行解析,将词汇和语法规则混合在一起。(但是,像Ohm这样的系统需要一个预解析阶段来处理缩进和凹陷。)             

当使用无扫描系统时,语言设计者和编译器编写者仍然会考虑符号和短语,但不必担心像所谓的最大Munch原则这样的复杂规则。Lookahead捕获您需要的任何类型的标记化方案。此外,无扫描解析的预测性意味着我们不必确定*是一元运算符指针解引用令牌,还是二进制乘法运算符令牌或星形令牌。在进行预测性分析时,我们总是有上下文。

Semantic Analysis

在语义分析过程中,我们必须检查合法性规则,同时,我们将语法树的片段(通过解析标识符引用、为隐式强制插入强制转换操作等)捆绑起来,形成一个语义图。             

继续上面的例子:

显然,每种语言的合法性规则是不同的。您可能会在类似Java的语言中看到的合法性规则示例包括:             

一个范围内的变量的多个声明              

在变量声明之前引用它             

引用没有声明的标识符             

违反访问(公共、私有、受保护等)规则             

方法调用中的参数太多             

方法调用中没有足够的参数             

类型不匹配(有很多这样的情况)

练习:列举以上每一个例子。             

在此阶段发生的错误称为静态语义错误。             

练习:Pascal语言在表达式方面有一种不同寻常的语法:它赋予and运算符(需要布尔操作数)比关系运算符更高的优先级!说明这意味着表达式x-4<=5和2<y是静态语义错误。

中间代码生成Intermediate Code Generation             

中间代码生成器生成一个流图,由分组到基本块中的元组组成。对于上面的例子,我们可以看到:

可以在其他地方阅读更多关于中间表示的内容。

Machine Independent Code Improvement

对语义图或中间代码进行的代码改进称为与机器无关的代码优化。在实践中,有无数已知的优化(er,改进),但没有一个真正适用于我们的运行示例。

Code Generation

代码生成产生实际的目标代码,或者类似的代码。这是我在使用面向x86-64的gcc 6.3进行组装时得到的结果,没有任何优化:

以下是ARM的代码,使用gcc 5.4,无需优化:

MIPS代码,gcc 5.4也未优化:

 Machine Dependent Code Improvement

通常编译的最后阶段是清理和改进目标代码。对于上面的例子,我在将优化级别设置为-O3时得到了如下结论:

Optimized ARM code:

Optimized MIPS code:

 

原文地址:https://www.cnblogs.com/wujianming-110117/p/13234641.html