编译原理归纳学习——除去晦涩

编译原理归纳学习——去除晦涩

NFA

1. (a|b)*ab的NFA

2. aa*|bb*的NFA

DFA

1. (a|b)*ab的DFA ？

NFA到DFA的变换

从NFA构造等价的DFA的一般思想是让新构造的DFA的每个状态代表NFA的一个状态集，这个DFA用它的状态去记住该NFA在读入符号后能到达的所有状态。

编译原理归纳学习——除去晦涩

写一个文法，使其语言是奇数集，且每个奇数不以0开头。
解：文法G(N)：
　　　　　　N→AB|B
　　　　　　A→AC|D
　　　　　　B→1|3|5|7|9
　　　　　　D→B|2|4|6|8
　　　　　　C→0|D

First集合的求法：
First集合最终是对产生式右部的字符串而言的，但其关键是求出非终结符的First集合，由于终结符的First集合就是它自己，所以求出非终结符的First集合后，就可很直观地得到每个字符串的First集合。
1. 直接收取：对形如U－a„的产生式（其中a是终结符），把a收入到First(U)中。

2. 反复传送：对形入U－P„的产生式（其中P是非终结符），应把First(P)中的全部内容传送到First(U)中。

3. 见下面给出的例1。

Follow集合的求法：
Follow集合是针对非终结符而言的，Follow(U)所表达的是句型中非终结符U所有可能的后随终结符号的集合，特别地，“#”是识别符号的后随符。

1. 直接收取：注意产生式右部的每一个形如“„Ua„”的组合，把a直接收入到Follow(U)中。

2. 直接收取：对形如“„UP„”(P是非终结符)的组合，把First(P)除ε直接收入到Follow(U)中。
3. 反复传送：对形如P－„U的产生式（其中U是非终结符），应把Follow(P)中的全部内容传送到Follow(U)中。(或 P－„UB且First(B)包含ε，则把First(B)除ε直接收入到Follow(U)中，并把Follow(P)中的全部内容传送到Follow(U)中)

例1：判断该文法是不是LL(1)文法，说明理由 S→ABc A→a|ε B→b|ε？
First集合求法就是：能由非终结符号推出的所有的开头符号或可能的ε，但要求这个开头符号是终结符号。如此题A可以推导出a和ε，所以FIRST（A）=｛a，ε｝；同理FIRST（B）={b,ε};S可以推导出aBc，还可以推导出bc，还可以推导出c，所以FIRST(S）=｛a，b，c｝。
Follow集合的求法是：紧跟随其后面的终结符号或＃。但文法的识别符号包含＃，在求的时候还要考虑到ε。具体做法是把所有包含你要求的符号的产生式都找出来，再看哪个有用。 Follow（S）=｛＃｝如求A的，产生式：S→ABc A→a|ε ，但只有S→ABc 有用。跟随在A后年的终结符号是FIRST（B）=｛b，ε｝，当FIRST（B）的元素为ε时，跟随在A后的符号就是c，所以 Follow（A）=｛b，c｝同理Follow（B）=｛c｝

消除左递归的例子：

编译原理归纳学习——除去晦涩

提取公共左因子：

编译原理归纳学习——除去晦涩

LL(1)文法：

编译原理归纳学习——除去晦涩

LL(1)文法预测分析法：

文法（4 1）'

1 E→TE′
2 E′→ATE′|ε
3 T→FT′
4 T′→MFT′|ε
5 F→(E)|i
6 A→+|-
7 M→*|/

再考虑文法(4 1)′，首先分别求出各个FIRST集和FOLLOW集如表41所示，再构造相应的LL(1)分析表如表42所示。现以输入符号串i+i*i为例，列出识别此符号串的过程如表43所示。

编译原理归纳学习——除去晦涩

上面的算法对应课本上的晦涩讲解为：

(1) 若a∈FIRST(γi)，则置M［A,a］=“A→γi”；
(2) 若ε∈FIRST(γj)，且a∈FOLLOW(A)，则置M［A,a］=“A→γj”；
(3) 除上述两种情况外，其余的一切表元素均置为“出错”。

注：M为LL(1)分析表

再来一个例子加深印象：

文法：

各个非终结符的first集合：

编译原理归纳学习——除去晦涩

关于follow集合我们只要考虑有可能变成空转换的非终结符：

编译原理归纳学习——除去晦涩

根据FIRST集和FOLLOW集可以生成一张LL(1)文法的预测分析表：

预测分析表法的分析过程:
要以表格的形式，列出分析栈的变化，输入，和输出动作：
以下是上面的文法对于id+id*id串的分析过程

（注：比如上表的第5行，T'本来可以表示成两种之一，但因为此时输入最左端是+，根据分析表T'应该取ε）

DAG图：

编译原理归纳学习——除去晦涩

[例]试对以下基本块B1应用DAG进行优化。

B1: A:=B*C

D:=B/C

E:=A+D

F:=E*2

G:=B*C

H:=G*G

F:=H*G

L:=F

M:=L

并就以下两种情况分别写出优化后的四元式序列：

（1）假设G、L、M在基本块后面背引用；

（2）假设只有L在基本块后被引用。

解：对于B1其DAG图：

(1)若只有G、L、M在基本块后被引用，则优化为：

G :=B*C

H := G*G

L := H*G

M := L

(2) 若只有L在基本块后被引用，则优化为：

G:= B*C

H :=G*G

L := H*G

[例]

T1 := A+B

T2 := A- B

F := T1 * T2

T1 := A- B

T2 := A – C

T3 := B - C

T1 := T1 * T2

G := T1 * T3

（注意T1和T2的位置变化）

三地址：

表达式x+y*z的三地址代码为：

t1:=y*z

t2:=x+t1

其中t1和t2是编译时需要的临时变量

三地址代码是语法树或dag的一种线性表示

a:= (-b + c*d ) + c*d

语法树的代码 dag的代码

t1:= -b t1 := -b

t2:= c*d t2:= c*d

t3:= t1+ t2 t3:= t1+ t2

t4:= c*d t4:= t3 + t2

t5:= t3 + t4 a:= t4

a:= t5

编译原理归纳学习——除去晦涩

三地址代码是中间代码的一种抽象形式，作为具体实现，通常有四元式、三元式及间接三元式几种形式。

一些三地址语句的相应四元式：

•x:=y op z (op, y, z, x)

•x:=-y (uminus,y, /, x)

•x:=y (:=, y, /, x)

•param x1 (param,x1, /, / )

•call P (call, /, /, P)

编译原理归纳学习——除去晦涩

间接三元式

三元式，四元式的运算次序即为其代码表中语句的次序，在三元式代码表的基础上另设一张表，按运算次序列出相应三元式在三元式表的位置，这张表称为间接码表。因此三元式表只记录不同的三元式语句，而间接码表则表示由这些语句组成的运算次序

编译原理归纳学习——除去晦涩

逆波兰：

也称后缀表达式，用它可以很轻松的计算表达式，对于开发一个简易的计算器是很重要的方法，给出表达式，转换为中缀表达式，再转换为逆波兰，再通过栈操作：

如果当前字符为变量或者为数字，则压栈，如果是运算符，则将栈顶两个元素弹出作相应运算，结果再入栈，最后当表达式扫描完后，栈里的就是结果。

正常的表达式逆波兰表达式

a+b ---> a,b,+

a+(b-c) ---> a,b,c,-,+

a+(b-c)*d ---> a,b,c,-,d,*,+

a+d*(b-c)--->a,d,b,c,-,*,+

a=1+3 ---> a=1,3 +

http=(smtp+http+telnet)/1024 写成什么呢？

http=smtp,http,+,telnet,+,1024,/

编译原理归纳学习——除去晦涩

三地址总结:

•对四元式而言，引用另一语句的结果可以通过引用相应语句的result(通常是一个临时变量)来实现，而间接三元式则通过间接码表来描述语句运算次序，这两种方法都改变了三元式的语句位置同时具两个功能的规定，因此代码调整时要作的改动只是局部的，要方便得多，当然四元式表示更接近程序设计习惯。

•四元式多了一个域(还需要临时变量)，间接三元式多了一个间接码表，与三元式相比，其存储空间当然要大些，但四元式与间接三元式两者的存储空间大致相当。

活动记录：

编译原理归纳学习——除去晦涩

参数传递：？

值调用

•实参的右值传给被调用过程

•值调用可以如下实现

–把形参当作所在过程的局部名看待，形参的存储单元在该过程的活动记录中。

编译原理归纳学习——除去晦涩

相关推荐