C语言编译程序实验:词法分析

3星 · 超过75%的资源 需积分: 9 45 下载量 155 浏览量 更新于2024-08-02 1 收藏 191KB DOC 举报
"该资源是一份关于编译原理实验的指导书,主要目的是通过使用C语言来编写一个针对C语言子集的一次性扫描编译器,以增进对编译原理的理解和掌握编译程序的实现技术。实验的核心部分是词法分析,包括设计、编程和测试词法分析程序,以便深入理解词法分析的原理。实验要求涉及识别特定的C语言关键字、符号,以及处理ID和NUM等其他标记。词法分析程序的输出为一系列二元组,包含单词的种别码、自身字符串和可能的整型常量。程序的主要算法思路是基于扫描到的字符类型来识别单词符号。" 在编译原理中,词法分析是至关重要的第一步,它负责将源代码分解成一个个有意义的单元,称为“单词符号”或“记号”。在这个实验中,实验者需要设计一个词法分析器,能够处理C语言子集中的一系列关键字(如main、if、else等)、专用符号(如=、+、-等)和其他标识符(ID)和数字(NUM)。词法分析器必须能够区分这些不同类型的单词,并且在处理过程中忽略空格。 实验要求实验者定义一个C语言子集的词法规则,包括所有可能出现的关键字、符号和其他标记。例如,ID由字母开头,后面可跟字母或数字;NUM则由一个或多个数字组成。实验者还需要为每种单词符号分配一个唯一的种别码,便于后续的语法分析阶段使用。 词法分析程序的功能在于接收源代码字符串,然后输出一系列的二元组,每个二元组包含单词的种别码、实际的单词字符串,以及对于数字来说的整数值。例如,当处理如下的源代码: ```c main() { int i = 10; while (i) i = i - 1; } ``` 词法分析器会输出如下的序列: `(1,main)(26,()(27,))(30,{}(2,int)(10,i)(21,=)(20,10)(34,;)(7,while)(26,()(10,i)(27,))(10,i)(21,=)(10,i)(23,-)(20,1)(34,;)(31,))` 这个过程显示了词法分析器如何识别并输出程序中的各个元素,如函数声明(main)、变量声明(int i)、赋值操作(=)等。 主程序的设计思路是通过扫描源程序的每一个字符,根据当前字符的类型和后续字符的组合来识别单词符号。这个过程通常涉及到状态机的实现,例如有限自动机,它可以根据字符流中的当前状态和下一个字符来决定如何转换状态,从而确定单词的类型。 通过这个实验,学习者将能深入理解编译器构造的基础,特别是词法分析这一阶段,这对于理解编译过程和计算机语言处理至关重要。此外,实践编写词法分析器还能提升编程技能,以及对C语言和编译原理的理论知识的理解。
2009-11-06 上传
附录c 编译程序实验 实验目的:用c语言对一个简单语言的子集编制一个一遍扫描的编译程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。 语法分析 C2.1 实验目的 编制一个递归下降分析程序,实现对词法分析程序所提供的单词序列的语法检查和结构分析. C2.2 实验要求 利用C语言编制递归下降分析程序,并对简单语言进行语法分析. C2.2.1待分析的简单语言的语法 实验目的 通过上机实习,加深对语法制导翻译原理的理解,掌握将语法分析所识别的语法成分变换为中间代码的语义翻译方法. 实验要求 采用递归下降语法制导翻译法,对算术表达式、赋值语句进行语义分析并生成四元式序列。 实验的输入和输出 输入是语法分析提供的正确的单词串,输出为三地址指令形式的四元式序列。 例如:对于语句串 begin a:=2+3*4;x:=(a+b)/c end# 输出的三地址指令如下: (1) t1=3*4 (2) t2=2+t1 (3) a=t2 (4) t3=a+b (5) t4=t3/c (6) x=t4 算法思想 1设置语义过程 (1) emit(char *result,char *arg1,char *op,char *ag2) 该函数功能是生成一个三地址语句送到四元式表中。 四元式表的结构如下: struct {char result[8]; char ag1[8]; char op[8]; char ag2[8]; }quad[20]; (2)char *newtemp() 该函数回送一个新的临时变量名,临时变量名产生的顺序为T1,T2,…. Char *newtemp(void) { char *p; char m[8]; p=(char *)malloc(8); k++; itoa(k,m,10); strcpy(p+1,m); p[0]=’t’; return(p); } (2)主程序示意图如图c.10所示。 (2) 函数lrparser在原来语法分析的基础上插入相应的语义动作:将输入串翻译成四元式序列。在实验中我们只对表达式、赋值语句进行翻译。 语义分析程序的C语言程序框架 int lrparser() { int schain=0; kk=0; if(syn=1) { 读下一个单词符号; schain=yucu; /调用语句串分析函数进行分析/ if(syn=6) { 读下一个单词符号; if(syn=0 && (kk==0)) 输出(“success”); } else { if(kk!=1 ) 输出 ‘缺end’ 错误;kk=1;} else{输出’begin’错误;kk=1;} } return(schain); int yucu() { int schain=0; schain=statement();/调用语句分析函数进行分析/ while(syn=26) {读下一个单词符号; schain=statement(); /调用语句分析函数进行分析/ } return(schain); } int statement() { char tt[8],eplace[8]; int schain=0; {switch(syn) {case 10: strcpy(tt,token); scanner(); if(syn=18) {读下一个单词符号; strcpy(eplace,expression()); emit(tt,eplace,””,””); schain=0; } else {输出’缺少赋值号’的错误;kk=1; } return(schain); break; } } char *expression(void) {char *tp,*ep2,*eplace,*tt; tp=(char *)malloc(12);/分配空间/ ep2=(char *)malloc(12); eplace=(char *)malloc(12); tt =(char )malloc(12); strcpy(eplace,term ());/调用term分析产生表达式计算的第一项eplace/ while(syn=13 or 14) { 操作符 tt= ‘+’或者‘—’; 读下一个单词符号; strcpy(ep2,term());/调用term分析产生表达式计算的第二项ep2/ strcpy(tp,newtemp());/调用newtemp产生临时变量tp存储计算结果/ emit(tp,eplace,tt,ep2);/生成四元式送入四元式表/ strcpy(eplace,tp); } return(eplace); } char *term(void)/仿照函数expression编写/ char *factor(void) {char *fplace; fplace=(char *)malloc(12); strcpy(fplace, “ ”); if(syn=10) {strcpy(fplace,,token);/将标识符token的值赋给fplace/ 读下一个单词符号; } else if(syn=11) {itoa(sum,fplace,10); 读下一个单词符号; } else if (syn=27) {读下一个单词符号; fplace=expression();/调用expression分析返回表达式的值/ if(syn=28) 读下一个单词符号; else{输出‘}’错误;kk=1; } } else{输出‘(’错误;kk=1; } return(fplace); }