一尘不染

使用正则表达式(PCRE)匹配a ^ nb ^ nc ^ n(例如“ aaabbbccc”)

php

众所周知的事实是,现代正则表达式实现(最著名的是PCRE)与正则语法的经典示例{a n b n ; n>
0}(例如aaabbb),使用此正则表达式(demo):

~^(a(?1)?b)$~

我的问题是:你能走多远?是否还可以使用PCRE 来解析上下文相关文法 {a n b n c n ; n> 0}(例如aaabbbccc)?


阅读 551

收藏
2020-05-26

共1个答案

一尘不染

受NullUserExceptions答案的启发(他已经删除了,因为它在一种情况下失败了),我认为自己已经找到了解决方案:

$regex = '~^
    (?=(a(?-1)?b)c)
     a+(b(?-1)?c)
$~x';

var_dump(preg_match($regex, 'aabbcc'));    // 1
var_dump(preg_match($regex, 'aaabbbccc')); // 1
var_dump(preg_match($regex, 'aaabbbcc'));  // 0
var_dump(preg_match($regex, 'aaaccc'));    // 0
var_dump(preg_match($regex, 'aabcc'));     // 0
var_dump(preg_match($regex, 'abbcc'));     // 0

说明

如果您考虑不使用正向超前断言(该(?=...)部分)的正则表达式,则具有以下内容:

~^a+(b(?-1)?c)$~

这无非是检查是否存在任意数量的as,然后检查bs和cs的数量是否相等。

这还不能满足我们的语法要求,因为as
的数量也必须相同。我们可以通过检查as的数量等于s的数量来确保b。这就是前瞻断言中的表达式所做的:(a(?-1)?b)c。该c所以我们不只是匹配的一部分是必要b秒。


结论

我认为这令人印象深刻,这表明现代正则表达式不仅能够解析非常规语法,而且甚至可以解析非上下文无关的语法。希望这将解决“您不能使用正则表达式来执行X,因为X不规则”的无休止的模仿。

2020-05-26