理解编译原理：上下文无关语法与二义性

需积分: 1 115 浏览量更新于2024-08-03 收藏 120KB DOCX 举报

编译原理的第二章节深入探讨了高级语言的语法描述，这是编程语言理解和设计的基础。在这个部分，首先定义了一个有穷的字母表，包括符号和空字的概念，这些都是构建语法结构的基本元素。运算中提到的子集连接和正规闭包概念，对于理解语言的构造规则至关重要。上下文无关文法是描述语言结构的关键工具，它由四个组成部分构成：终结符号（如基本单词、标识符等）、非终结符号（表示语法结构的抽象类别）、一个开始符号（通常是程序的起点），以及一组产生式。产生式描述了如何从非终结符号通过替换和组合生成终结符号的序列。例如，通过“E => E+i”这样的规则，可以逐步构建表达式。在上下文无关法中，最左推导和最右推导是两种分析方式，它们遵循不同的替换策略。尽管这两种方法可能得到不同的语法树，但这并不意味着文法本身是二义的。二义性是指一个文法可能允许同一句型有多种合法的语法树表示。例如，文法G(E)：Ei|E+E|E*E|(E)被指出是二义的，因为它允许(i*i+i)有不同的解析。语法树是一种可视化工具，用于清晰展示句型的推导过程，有助于理解语言结构。然而，判断一个文法是否二义性的问题是理论计算机科学中的一个难题，属于不可判定问题，这意味着没有通用的算法可以在有限步骤内确定一个文法是否具有二义性。尽管如此，有一些条件可以确保文法的无二义性，比如从一个非终结符出发，能够唯一地推导出所有可能的终结符序列。例如，从1开始，经过有限步操作能够唯一生成自然数序列。这些条件提供了一种寻找无二义文法的有效途径，即使对于二义性的文法，只要能找到相应的无二义文法等价描述，语言的含义是不会改变的（即L(G)=L(G')）。理解高级语言的语法描述不仅涉及符号的规则，还涉及到推导策略和语言特性的复杂性分析。

2.3 程序语言的语法描述

一、程序语言的语法描述

设

∑

是一个有穷的字母表，它的每一个元素称为符号。不包含任何符号的序列称为空字。

∑

∗

表示

∑

上的所有符号串全体，空字记为ε。

运算：

∑

∗

的子集 U 和 V 的连接（积）定义为

𝑈𝑉

{𝛼𝛽|𝛼

∈

𝑈

𝛽

∈

𝑉}

V 自身的 n 次积，记为

𝑉

𝑛

𝑉𝑉

···

𝑉

∗

是 V 的闭包：

𝑉

∗

𝑉

∪

𝑉

∪

···

∪

𝑉

𝑛

𝑉

是 V 的正规闭包：

𝑉

∗

二、上下文无关法

一个上下文无关文法 G，由四个部分构成：

· 一组终结符号，用

𝑉

𝑇

字符表示。组成语言的基本符号，程序设计语言中指单词符号（基

本字、标识符、常数、算符、界符等）；从语法分析角度，指语言不可再分的基本符号。

· 一组非终结符号用

𝑉

𝑁

表示。非终结符代表一个一定的语法概念，是一个类的集合，并

非个体记号，每个非终结符表示一定符号串的集合（由终结符号和非终结符号组成的符

号串）

· 一个开始符号

𝑆

∈

𝑉

𝑁

，它是一个特殊非终结符号

· 一组产生式，一个产生式的表示是

𝐴→𝛼

A 是一个非终结符，又称为产生式的左部符号。

下载后可阅读完整内容，剩余3页未读，立即下载

Issac-Clarke

粉丝: 360
资源: 20

理解编译原理：上下文无关语法与二义性

现代编译原理：Ｃ语言描述

现代编译原理：c语言描述

《现代编译原理：C语言描述》

现代编译原理:c语言描述 的代码

编译原理的短语 句柄 句型 句子

现代编译原理c语言描述 修订版 pdf

编译原理期末考试抽象语法树题目

程序设计语言 编译原理 陈火旺 pdf

编译原理 ast语法树

编译原理词法分析语法分析语义分析c++

最新资源

现代编译原理:c语言描述的代码

编译原理的短语句柄句型句子

现代编译原理c语言描述修订版 pdf

程序设计语言编译原理陈火旺 pdf