一尘不染

如何用C#编写解析器?

c#

我该如何用C#编写解析器(递归下降?)?现在,我只需要一个简单的解析器来解析算术表达式(并读取变量?)。虽然稍后我打算编写一个xml和html解析器(出于学习目的)。我之所以这样做,是因为解析器在其中非常有用:Web开发,编程语言解释器,内部工具,游戏引擎,地图和图块编辑器等。那么编写解析器的基本原理是什么,我该怎么办?在C#中实现一个?C#是解析器的正确语言吗(我曾经用C
++写过一个简单的算术解析器,并且效率很高。JIT编译是否同样有效?)。任何有用的资源和文章。最重要的是,代码示例(或代码示例的链接)。

注意:出于好奇,是否有人回答过此问题,是否曾在C#中实现解析器?


阅读 301

收藏
2020-05-19

共1个答案

一尘不染

我已经在C#中实现了几个解析器-手写的和生成的工具。

关于解析的一个很好的入门教程是“
让我们构建一个编译器”,它演示了如何构建递归下降解析器。对于任何称职的开发人员,这些概念都可以轻松地从他的语言(我认为是Pascal)翻译成C#。这将教您递归下降解析器的工作原理,但是用手编写完整的编程语言解析器是完全不切实际的。

如果确定要编写经典的递归下降解析器TinyPGCoco
/
R
Irony),则应该研究一些工具来为您生成代码。请记住,还有其他方法来写解析器现在,通常有更好的表现-
和具有容易定义(例如TDOP解析一元解析)。

关于C#是否适合完成该任务的主题-C#具有一些最好的文本库。如今,许多解析器(使用其他语言)都有处理Unicode等内容的淫秽代码。我不会对JITted代码发表过多评论,因为它可能会引起很大的反响-
但是,您应该很好。IronJS是CLR上的解析器/运行时的一个很好的例子(尽管它是用F#编写的),并且其性能仅次于Google
V8。

旁注: 与语言解析器相比,标记解析器是完全不同的野兽-在大多数情况下,它们是手工编写的,并且在扫描器/解析器级别非常简单;它们通常不是递归下降的-
特别是在XML的情况下,最好不要编写递归下降的解析器(以避免堆栈溢出,并且因为可以在SAX / push模式下使用“平面”解析器)。

2020-05-19