c语言小子集,C语言小子集的词法分析程序
时间: 2023-10-05 20:06:41 浏览: 93
C语言小子集是C语言的一个子集,包含了C语言的一些基本语法和数据类型。以下是一个简单的C语言小子集的词法分析程序示例:
```c
#include <stdio.h>
#include <ctype.h>
#include <string.h>
#define MAXTOKEN 100
enum { NAME, PARENS, BRACKETS };
void dcl(void);
void dirdcl(void);
int gettoken(void);
int tokentype; // 最后一个记号的类型
char token[MAXTOKEN]; // 最后一个记号的字符串
char name[MAXTOKEN]; // 标识符名
char datatype[MAXTOKEN]; // 数据类型为 char、int 等
char out[1000]; // 输出字符串
int main() {
while (gettoken() != EOF) {
strcpy(datatype, token); // 该标识符的数据类型
out[0] = '\0';
dcl();
if (tokentype != '\n')
printf("syntax error\n");
printf("%s: %s %s\n", name, out, datatype);
}
return 0;
}
// 返回下一个标记
int gettoken(void) {
int c, getch(void);
void ungetch(int);
char *p = token;
while ((c = getch()) == ' ' || c == '\t')
;
if (c == '(') {
if ((c = getch()) == ')') {
strcpy(token, "()");
return tokentype = PARENS;
} else {
ungetch(c);
return tokentype = '(';
}
} else if (c == '[') {
for (*p++ = c; (*p++ = getch()) != ']'; )
;
*p = '\0';
return tokentype = BRACKETS;
} else if (isalpha(c)) {
for (*p++ = c; isalnum(c = getch()); )
*p++ = c;
*p = '\0';
ungetch(c);
return tokentype = NAME;
} else
return tokentype = c;
}
// 分析一个声明
void dcl(void) {
int ns;
for (ns = 0; gettoken() == '*'; ) // 统计字符 * 的个数
ns++;
dirdcl();
while (ns-- > 0)
strcat(out, " 指向");
}
// 分析一个直接声明
void dirdcl(void) {
int type;
if (tokentype == '(') {
dcl();
if (tokentype != ')')
printf("error: missing )\n");
} else if (tokentype == NAME)
strcpy(name, token);
else
printf("error: expected name or (dcl)\n");
while ((type = gettoken()) == PARENS || type == BRACKETS) {
if (type == PARENS)
strcat(out, " 函数返回");
else {
strcat(out, " 数组");
strcat(out, token);
strcat(out, " of");
}
}
}
```
该程序可以将类似于 `int (*(*foo[5])())[10]` 的声明解析成可读的字符串,输出为 `foo 是一个数组 5 个指向函数的指针,该函数返回一个指向数组 10 个 int 类型数据的指针`。
阅读全文