「编译原理」“根据LL(1)求FIRST集” 书本算法的解析及改进

笔者使用的是刘坚编著的《编译原理基础（第二版）》2008年9月第2版 2012年5月第8次印刷的版本。

书P74页中
算法3.5 计算X的FIRST集合
输入：文法符号X。
输出：X的FIRST集合。
方法：应用下述规则，
（1）若X是终结符，则FIRST(X) = {X}。
（2）若X是非终结符且有X→ε，则加入ε到FIRST(X)中。
（3）若X是非终结符且有X→Y1Y2…Yk，并令Y0=ε，Yk+1=ε，则从左到右对所有j(0≤j≤k),若a∈FIRST(Yj+1)且ε∈FIRST(Yj),则加入a到FIRST(X)中。

以下为自己的一些想法，如有纰漏，还望指正！

首先，解释一下什么是FIRST集：

对于一个符号X最后转化为实例（只由终结符组成）时，这个实例的第一个字符（如果实例长度为0则用ε表示这个字符）的所有可能情况组成的集合称为X的FIRST集合，简称FIRST(X)。

对于算法3.5执行流程，我的理解是这样的：

规则（1）：对于终结符a，因为它的实例只有a一个，所以FIRST(a)必然是{a}。
规则（2）：对于非终结符A，存在文法 A→ε，那么A的实例为空，即长度为0所以用ε表示该实例的第一个字符，将ε加入到FIRST(A)中。
规则（3）：对于非终结符A，存在文法 A→BCDE，将该文法的右部看成εBCDEε，
①判断ε∈FIRST(ε)，如果符合的话则将FIRST(B)加入到FIRST(A)中；
②判断ε∈FIRST(B)，如果符合的话则将FIRST(C)加入到FIRST(A)中；
③判断ε∈FIRST(C)，如果符合的话则将FIRST(D)加入到FIRST(A)中；
④判断ε∈FIRST(E)，如果符合的话则将ε加入到FIRST(A)中。

对于规则（1）（2）较为容易理解，我也并没有什么可改进的。
对于规则（3）我的理解如下：

按照FIRST集的定义，对于文法A→BCDE，FIRST(A)是指A的所有实例第一个字符的集合，那么我们将BCDE转换为实例有两种可能：
1) B不为空时，这时符号A的第一个字符必然属于B不为空时的所有可能第一个字符的集合，即应该将 FIRST(B)-{ε} 加入 FIRST(A) ；
2) B为空时，这时文法A→BCDE就缩减成A→CDE，这个时候只需要重复上面的步骤即可。

那么我们需要考虑的问题是如下：
算法3.5 为什么要做

从左到右对所有j(0≤j≤k),若a∈FIRST(Yj+1)且ε∈FIRST(Yj),则加入a到FIRST(X)中

我们再看上面的算法执行流程：

①判断ε∈FIRST(ε)，如果符合的话则将FIRST(B)加入到FIRST(A)中；
②判断ε∈FIRST(B)，如果符合的话则将FIRST(C)加入到FIRST(A)中；
③判断ε∈FIRST(C)，如果符合的话则将FIRST(D)加入到FIRST(A)中；
④判断ε∈FIRST(E)，如果符合的话则将ε加入到FIRST(A)中。

在第一步做看似毫无意义的判断ε∈FIRST(ε)的原因是：符号B作为文法A→BCDE右部的第一个符号，必然需要将FIRST(B)加入到FIRST(A)中，所以判断本身并不重要，但做判断后能提高算法的统一性和表达的简洁性，如果单列出来，算法会显得过于冗长；

在后续步骤中，不断判断ε∈FIRST(B/C/D/E)的原因是：考虑到B/C/D/E有可能为空，则文法形式可能会不断缩减，极端的实例是BCDE都为空，则文法变成A→ε，所以在最后将ε加入FIRST(A)。

这么看来算法3.5好像没有什么问题，但我注意到：

推论：如果B绝对不为空，即文法A→BCDE绝对不会缩减成A→CDE，这时会怎么样？也就是说无论CDE是否可能为空，那么文法一定是A→B……，那么对于这个文法，FIRST(A)必然等于FIRST(B)。

那么按照这个设定（ε∉FIRST(B)，ε∈FIRST(C)），我们再看算法的执行过程

①判断ε∈FIRST(ε)，符合！将FIRST(B)加入到FIRST(A)中；
②判断ε∈FIRST(B)，不符合；
③判断ε∈FIRST(C)，符合！将FIRST(D)加入到FIRST(A)中；

这个时候FIRST(A)包含了FIRST(B)和FIRST(D)，但是按照我们推论，FIRST(A)必然等于FIRST(B)，而FIRST(B)和FIRST(D)之间的关系是不明确的，所以按照算法3.5得到的结果存在问题！

所以我认为该算法应该做一定修改，以下是我做出修改后的算法

算法3.5改计算X的FIRST集合
输入：文法符号X。
输出：X的FIRST集合。
方法：应用下述规则，
（1）若X是终结符，则FIRST(X) = {X}。
（2）若X是非终结符且有X→ε，则加入ε到FIRST(X)中。
（3）若X是非终结符且有X→Y1Y2…Yk，对于j(1≤j≤k)，若ε∈FIRST(Yj)，则将到 FIRST(Yj)-{ε} 加入 FIRST(X)中，其中若j=k，则将ε加入 FIRST(X)中；否则，将FIRST(Yj)加入 FIRST(X)中，直接结束算法。

按照这个修改后的算法执行设定（ε∉FIRST(B)，ε∈FIRST(C)）：

①判断ε∈FIRST(B)，不符合！将FIRST(B)加入到FIRST(A)中，结束算法；

这时FIRST(A)等于FIRST(B)，符合预期。

原创文章，转载请全文转载并注明出处

http://www.cnblogs.com/777777-716/p/5003960.html