C++编译原理词法分析入门教程：识别单词符号与内部表示

需积分: 34 184 浏览量更新于2024-09-04 1 收藏 104KB DOC 举报

编译原理中词法分析是编译器构造的重要步骤，特别是在使用C++进行实现时。这个文档为初学者提供了一个实践项目，通过阅读源程序文件中的字符流，识别并转换成内部表示的二元组。以下是核心知识点的详细解析： 1. **任务目标**：从源程序中逐个单词地读取字符流，通过词法分析算法将其划分为不同的词类，如关键字、标识符、常数等，并转化为相应的内部表示形式，如种别编码和属性值。 2. **数据结构**： - 主程序中定义了关键的数据结构： - `id`数组用于存储标识符，每个标识符占30个字符的空间。 - `ci`数组用于存储常数值。 - `character`数组用于临时存储从文件中读取的字符。 - `constNum`和`biaoshifuNum`分别计数常数和标识符的数量。 - `key`数组列出了预定义的关键字列表。 - `operators`数组包含了常用的运算符。 3. **词法分析过程**： - 每个单词分析开始于输入的字符，根据字符类型（可能是第一个或第二个字符）判断其属于哪种词类。 - 对于标识符，会检查它是否在标识符表中已存在，如果存在则记录其在表中的位置，否则添加到`id`数组中并更新计数。 - 对于常数，同样检查是否在常数表中，记录位置；若不存在，则存储到`ci`数组中并增加计数。 4. **编码与输出**： - 在词法分析过程中，每个单词会被转换成种别编码，这是基于识别出的词类和可能的属性值。例如，关键字会有特定的编码，标识符和常数则可能有不同类型编码，如标识符编号。 - 分析完成后，输出每个单词的内部表示，包括种别编码和属性值，以便后续的语法分析阶段处理。 5. **代码实现**： - 提供的C++代码包括`#include`语句，用于引入必要的库函数。`std::ifstream`用于从文件读取字符流，`std::string`用于处理字符串操作。 - `int i=0`初始化计数器，用于遍历输入的字符序列。 - 使用循环结构，对输入流中的每个单词执行词法分析。 6. **调试建议**： - 代码设计应注重可调试性，确保每个单词处理的逻辑清晰，便于定位和修改错误。建议在循环结构中添加适当的断点和日志输出，便于跟踪分析过程。这份文档提供了词法分析在C++环境下的具体实现方法，通过实际操作帮助学习者理解编译原理的基本步骤，并掌握如何将源代码分解成可处理的单元，即单词及其对应的内部表示。这对于理解和构建自己的编译器或解释器至关重要。

从源程序文件中读取有效字符流并将其分析识别单词符号，转换成二元组内部

表示形式输出。

主程序的说明部分为各种表格和变量安排空间（关键字和特殊符号表）。

id 和 ci 数组分别存放标识符和常数；还有一些为造表填表设置的变量。

主程序的工作部分建议设计成便于调试的循环结构。每个循环处理一个单

词；调用词法分析过程；输出每个单词的内部码（种别编码，属性值）。建议

从文件中读取要分析的符号串。

该过程根据输入单词的第一个有效字符（有时还需读第二个字符），判断

单词种别，产生种别编码。对于标识符和常数，需分别与标识符表和常数表中

已登记的元素相比较，如表中已有该元素，则记录其在表中的位置，如未出现

过，将标识符按顺序填入数组 id 中，将常数存入数组中 ci 中，并记录其在表

中的位置。

编号

1 2 3 4 5 6 7 8 9 10

名字

int cha

oat voi

const if else do while scanf

编号

11 12 13 14 15 16 17 18 19 20

名字

printf return main

rea

+ – * / % =

编号

21 22 23 24 25 26 27 28 29 30

名字

= = > <

！=

>= <

&& || ! <>

编号

31 32 33 34 35 36 37 38 39 40

名字

( ) { }

；

, “ ‘ ++ --

下载后可阅读完整内容，剩余8页未读，立即下载

Misaki.Mei

粉丝: 770
资源: 3

C++编译原理词法分析入门教程：识别单词符号与内部表示

编译原理 实验一 词法分析器设计源代码+实验报告

编译原理 C语言实现词法分析

C语言ＤＦＡ词法分析器

C++编译原理：词法分析器实现与实验报告

编译原理：词法分析源码解析

C++编译原理：词法分析器详解与代码实现

C++实现编译原理：词法分析实验

编译原理：词法分析深入讲解

编译原理：词法分析的不可或缺性

编译原理：理解词法分析的重要性

最新资源

编译原理实验一词法分析器设计源代码+实验报告