LL(1)解析器组合子：从基础到高效错误处理

176 浏览量更新于2024-06-17 收藏 518KB PDF 举报

"《理论计算机科学电子笔记》第41卷第1期，作者S.D.斯维尔斯特拉，文章‘Combinator解析器：从玩具到工具’，讨论了如何构建确定性、纠错的Combinator解析器，特别关注LL(1)文法和前瞻序列的使用，以优化性能和处理错误输入。" 本文详细探讨了Combinator解析器的构造和优化，一种用于语法分析的工具。传统的Combinator解析器在面对大型语法时效率下降，并且在处理非语言句子时容易崩溃。作者在文中提出了一种新的Combinator组合方式，旨在解决这些问题，尤其是针对那些具有LL(1)属性的文法。LL(1)文法允许解析器通过查看输入的下一个符号来决定解析过程的下一步，从而简化自顶向下的解析策略。对于那些不能直接表示为LL(1)形式的文法，通常需要通过左因子分解来转换，但这可能导致与原始语言设计的不匹配。为了解决这一问题，作者扩展了之前的Combinator组合子，引入了处理更长前瞻序列的新方法，同时保持解析器的有效性和错误处理能力。这种方法的一个关键要求是避免直接或间接的左递归，这可以通过使用特定的链组合子来实现，这种方式通常更能准确表达语言设计者的意图。文章进一步阐述了如何在解析器中整合前瞻信息，以驱动计算过程，同时尽量减少对输入符号的检查次数，以提高效率。在第5节中，作者可能提供了关于这些技术在实际大型解析器构造中的应用案例，以及如何利用这些解析器组合子来维护错误修复所需的信息，而且这些额外的成本在实际应用中是可忽略不计的。该文深入研究了Combinator解析器的构造和优化，为编译器和其他需要语法分析的领域提供了有价值的理论和实践指导。通过使用改进的Combinator组合子，开发者能够构建更强大、更健壮的解析器，以应对复杂的语言结构和错误输入，同时保持高效性能。

S维尔斯

特拉

combinators

来描述非常大的语法，如：

1000万元人民币（<|>）（map symbol [1.. 1000]）

这里平均需要500次比较才能识别一个符号。这样的解析器可以很容易

地通过使用更复杂的派生组合子来隐式地构造，而用户实际上没有注

意到。

潜在的不确定性的另一个来源是由非决定论造成的。当许多备选方

案可以识别具有公共前缀的字符串时，这个前缀将被解析多次，通常

只有一个备选方案最终成功。因此，对于高度尽管如何从非确定性自

动机构造确定性自动机是众所周知的，但是在该实现中不使用该知

识，也不容易将其合并。

我们现在开始描述一个新的实现，它解决了所有提到的问题。

纠错

3.1

基于延续的解析

如果我们扩展上一节中的组合子来跟踪输入中到达的最远点，则解析

器仅在回溯完成后才返回该值。不幸的是，到那时我们已经失去了所

有的上下文信息，这些信息可能使我们能够决定正确的纠错步骤。因

此，我们将首先将组合子转换为一种形式，这种形式允许我们同时处

理所有可能的替代方案，从而从搜索空间的深度优先探索转变为广度

优先探索。这种广度优先的方法可以被看作是一种使许多解析器并行

工作的方法，每个解析器探索一条可能的路径。

作为第一步，我们在图2中介绍了组合子，它们是使用基于延续

的风格构造的。正如我们将看到的，这将使得在构造完整的解析之

前

提供有关解析过程如何进行的信息成为可能

我们暂时忽略要计算的

结果，只返回一个布尔值，表明句子是否属于该语言。continuation

参数

表示解析过程的其余部分，当当前解析器成功时将调用它它可

以被看作是从部分识别的产品的右手侧封装了一堆未说明的符号，

输入的其余部分将与之匹配。我们再次定义了一个函数parse来启动

解析过程。它的continuation参数是函数null，它检查

当挂起符号的堆

栈被

耗尽时，输入是否

剩余23页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

LL(1)解析器组合子：从基础到高效错误处理

组合优化（Combinatorial+Optimization+Theory+and+Algorithms）

组合优化--a course in combinatorial optimization

parser-combinator-js:由 G. Hutton 和 E. Meijer 定义的 monadic 解析器组合器的 Javascript 实现

y_combinator_cpp:cpp中的y组合器

y-combinator-notes:定点组合器的注意事项

CakePHP-Combinator-Plugin:用于 CakePHP 2.1 的组合器插件 - 组合、缩小和缓存 Javascript 和 CSS 文件以加快加载时间

y-combinator-tutorial:Y组合器的简短描述，但很有启发性

y_combinator_js:Y-combinator 算法的人类可读解释

combinator：支持静态类型，文件范围等的解析器组合器

ts-combinator:一个简单的打字稿解析器组合器库

最新资源