first集_编译原理中FIRST集和FOLLOW集是什么东西?
时间: 2024-03-30 13:38:33 浏览: 144
在编译原理中,FIRST集和FOLLOW集是用于描述文法的一种符号集合。
首先,FIRST集表示一个文法符号能够推导出的所有可能的字符串的首字符集合。对于一个文法符号,它的FIRST集包括以下内容:
1. 如果这个符号是一个终结符(即不再能够被进一步推导的符号),那么它的FIRST集就是该终结符本身。
2. 如果这个符号能够推导出一个或多个以终结符开头的字符串,那么它的FIRST集就包括这些字符串的首字符。
3. 如果这个符号能够推导出一个或多个以非终结符开头的字符串,那么它的FIRST集就包括这些非终结符的FIRST集。
其次,FOLLOW集表示一个文法符号在某个产生式中的右侧能够紧随其后的所有可能的符号集合。对于一个文法符号,它的FOLLOW集包括以下内容:
1. 如果这个符号是文法的开始符号,那么它的FOLLOW集就包括文法的结束符号。
2. 如果这个符号在某个产生式的右侧能够紧随其后,那么它的FOLLOW集就包括该产生式左侧符号的FOLLOW集。
3. 如果这个符号在某个产生式的右侧能够紧随其后,且该符号右侧的字符串能够推导出 ε(即空串),那么它的FOLLOW集就包括该产生式左侧符号的FOLLOW集。
相关问题
编译原理first集和follow集求解代码
编译原理中的FIRST集合和FOLLOW集合主要用于分析文法的LL(1)解析过程中,它们描述了从某个特定状态开始,下一个可能读取的字符集合。第一集(First Set)表示给定一个非终结符或终结符,所有可能直接跟在其后的第一个字符集合;而跟随集(Follow Set)则表示对于一个非终结符,在当前文法规则下,后续能出现的最右边的终结符集合。
这里是一段简单的Python示例,使用有限自动机(Finite Automaton)库计算First和Follow集合:
```python
from collections import defaultdict
def first_set(grammar, start):
# 初始化 FIRST 集合
first = defaultdict(set)
for rule in grammar:
left, right = rule.split('->')
if not left in first:
first[left] = { Terminal(t) for t in right.split() } # 如果是终结符,则添加到 FIRST 集
else:
first[left].update({ Terminal(t) for t in right.split() }) # 否则合并集合
return first
# 示例文法和起始符号假设已定义
start = 'S'
grammar = ... # 这里应该是一个包含文法规则的列表
first = first_set(grammar, start)
print("First Set:", first)
def follow_set(grammar, nonterminal, first):
follow = set()
for rule in grammar:
left, right = rule.split('->')
if left == nonterminal and Terminal('$') in first[right]: # 如果左右两边的第一集有 $
follow.add(Terminal('$'))
elif Terminal('.') in first[right]: # 如果有 .,说明是文法结束
follow.add(Terminal('.'))
return follow
follow = follow_set(grammar, start, first)
print("Follow Set:", follow)
```
注意:这只是一个简化的示例,实际的文法分析更为复杂,可能需要处理更复杂的规则、空格和词法结构。这里的`Terminal`类用于标识终结符。在实际应用中,这些通常会通过更专业的编译工具库如PLY或ANTLR来完成。
编译原理LL1文法FIRST 和FOLLOW集
### 编译原理 LL(1) 文法 FIRST 和 FOLLOW 集合 计算 方法
#### 定义与概念
对于给定的上下文无关文法 (CFG),FIRST和FOLLOW集合用于描述非终结符可能推导出的第一个符号以及紧跟在其后的符号。
- **FIRST集**表示某个符号串能够推导出来的最左边第一个终结符组成的集合。如果该符号串可以推导出ε(空字符串),那么也认为ε属于这个符号串的FIRST集[^3]。
- **FOLLOW集**是指某非终结符A后面可能出现的终结符构成的集合,即在任何可由起始符号S派生出的句型中,在紧接于A之后出现的终结符a所形成的集合;另外还包括当且仅当A能出现在某些句型结尾处时$(代表输入结束标志)也会成为其成员之一。
#### 计算方法
##### FIRST集计算:
1. 对于每一个终结符`a`,有`FIRST(a)`等于{ `a` };
2. 如果存在产生式`A -> ε`,则将ε加入到`FIRST(A)`中;
3. 若有一个产生式形式为`A → X₁X₂...Xₙ`,
- 初始化临时变量tempSet为空集
- 依次考虑每个Xi(i=1,2,...n)
- 将`FIRST(Xi)\ {ε}`中的所有元素都加到tempSet里
- 如果`ε ∈ FIRST(Xi)`
- 继续处理下一个Xi直到遇到不包含ε的情况为止
- 或者已经遍历完了所有的Xi此时应把ε也放入最终的结果集中
4. 迭代上述过程直至不再发生变化[^5]。
```cpp
void compute_first_sets() {
bool changed;
do {
changed = false;
for each non_terminal A in grammar {
foreach production rule of form A->α {
set temp_set = {};
int i = 0;
while (true){
if (first[i][alpha[i]] contains epsilon || i >= length(alpha)){
add all elements from first[i][alpha[i]] to temp_set except epsilon;
break;
}
else{
add all elements from first[i][alpha[i]] to temp_set;
++i;
}
}
if (!subset_of(temp_set, first[A])){
union(first[A], temp_set);
changed |= true;
}
}
}
}while(changed);
}
```
##### FOLLOW集计算:
1. 把 `$`(输入结束标记) 加入到开始符号 S 的 FOLLOW(S) 中;
2. 对于每条规则`A→αBβ`:
- 把`FIRST(β)\{ε}`里的所有元素添加至`FOLLOW(B)`内;
- 当`ε∈FIRST(β)`时还需进一步操作如下两种情况:
- 如果 B 是最后一个符号(`A→αB`),则直接将整个`FOLLOW(A)`复制过来作为新的部分并加入到`FOLLOW(B)`之中;
- 否则继续向右寻找其他可能影响到`FOLLOW(B)`的因素,重复执行此步骤直到无法再找到更多贡献源位置停止。
```cpp
void compute_follow_sets(){
follow[start_symbol].insert('$');
bool change_made;
do {
change_made = false;
for each production P : A -> α.Bγ where '.' indicates current position before symbol γ and after sequence α,
// Case when dot is at the end or next character can derive empty string.
if(dot_position == last_char_or_next_chars_can_derive_empty_string()){
extend(follow[B],follow[A]);
mark_as_visited(P);
}
// For other cases just take first set without considering epsilon transitions.
else{
extend(follow[B],first[dot_character]-{'epsilon'});
}
update_change_flag(change_made);
}while(has_unvisited_productions());
}
```
阅读全文