C语言编译原理：词法分析代码实战与理解

需积分: 34 149 浏览量更新于2024-08-04 7 收藏 89KB DOC 举报

本资源是一份关于编译原理中词法分析的C语言程序实现教程。课程的核心目标是设计和编写一个词法分析器，以便深入理解编译器构造中的词法分析阶段。这个阶段是编译过程的第一步，它将源程序分解为有意义的符号单元，即词法单元，如关键字、运算符、标识符和整型常数。在实验中，需要处理的词法单元包括： 1. 关键字：如`begin`, `if`, `then`, `while`, `do`, `end`等，它们对应于种别码1到6。 2. 运算符和界符：包括赋值运算符`=`,算术运算符`+`, `-`, `*`, `/`,关系运算符`<`, `>`, `<=`, `>=`,以及一些特殊符号如`;`, `(`, `)`, `#`，分别对应种别码11到28。 3. 标识符（ID）和整型常数（SUM）：ID由字母和数字组成，SUM由两个连续的数字组成，符合正则表达式`ID=letter(letter|digit)*`和`NUM=digitdigit*`，这些符号被分类为种别码10和11。 4. 空格：用于分隔其他元素，但词法分析阶段会忽略它们，不计入输出结果。词法分析程序的主要功能是接收一个源程序字符串作为输入，然后解析并输出一个二元组序列，每个二元组包含单词的种别码（syn）、单词自身（token）和整型常数（仅限于SUM）。例如，对于源程序`beginx:=9:ifx>9thenx:=2*x+1/3;end`，经过词法分析后的输出将包含一系列如`(1, begin)`、`(10, x)`这样的元素。提供的C语言程序源代码示例展示了如何实现这个功能，使用了`stdio.h`, `string.h`, `conio.h`, 和 `stdlib.h`等库函数。程序结构包括一个`scaner()`函数，可能负责逐个字符处理源程序，以及`main()`函数中读取用户输入并调用`scaner()`函数。整个程序的目的是确保能够正确识别并分类输入的源代码中的词法单元，并以预期的输出格式展示出来，这对于理解和实践编译原理至关重要。

词法分析 c 语言实现

一、实验目的

设计、编制并调试一个词法分析程序，加深对词法分析原理的理解。

二、实验要求

2.1 待分析的简单的词法

（1）关键字：

begin if then while do end

所有的关键字都是小写。

（2）运算符和界符

： = + - * / < <= <> > >= = ; ( ) #

（3）其他单词是标识符（ID）和整型常数（SUM），通过以下正规式定义：

ID = letter (letter | digit)*

NUM = digit digit*

（4）空格有空白、制表符和换行符组成。空格一般用来分隔 ID、SUM、运算符、界符

和关键字，词法分析阶段通常被忽略。

2.2 各种单词符号对应的种别码：

表 2.1 各种单词符号对应的种别码

单词符号

种别码

单词符号

种别码

begin

：

：=

Then

wile

end

lettet（letter|digit）*

dight dight*

；

—

(

)

2.3 词法分析程序的功能：

输入：所给文法的源程序字符串。

输出：二元组（syn,token 或 sum）构成的序列。

其中：syn 为单词种别码；

token 为存放的单词自身字符串；

sum 为整型常数。

例如：对源程序 begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件，经过词法分析后输出如

下序列：

(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)……

三、词法分析程序的 C 语言程序源代码：

#include <stdio.h>

#include <string.h>

#include <conio.h>

下载后可阅读完整内容，剩余5页未读，立即下载

吴雨4

粉丝: 6928
资源: 2

C语言编译原理：词法分析代码实战与理解

实验一 编译原理 词法分析.rar

编译原理实验一——C 语言词法分析器设计与实现

编译原理实验二 词法分析

编译原理词法分析程序c语言

编译原理词法分析用简单C语言实现不通过文件导入输入而是直接输入进行分析

编译原理词法分析器c语言

编译原理词法分析器识别c语言浮点数的识别程序的c语言代码

编译原理词法分析C语言实现直接输入进行分析

编译原理词法分析器c语言实现

编译原理词法分析器C语言版

最新资源

实验一编译原理词法分析.rar

编译原理实验二词法分析