一尘不染

PHP:正则表达式忽略引号内的转义引号

php

在发布此内容之前,我仔细阅读了相关问题,并且无法修改任何相关答案以使用我的方法(不擅长使用正则表达式)。

基本上,这是我现有的行:

$code = preg_replace_callback( '/"(.*?)"/', array( &$this, '_getPHPString' ), $code );

$code = preg_replace_callback( "#'(.*?)'#", array( &$this, '_getPHPString' ), $code );

它们都匹配''和之间包含的字符串""。我需要正则表达式忽略它们之间包含的转义引号。因此,之间的数据''将被忽略,\'而之间的数据""将被忽略\"

任何帮助将不胜感激。


阅读 313

收藏
2020-05-26

共1个答案

一尘不染

对于大多数字符串,您需要允许转义 任何内容
(而不仅仅是转义引号)。例如,你很可能需要允许转义字符像"\n""\t"当然,转义逃逸:"\\"

这是您要查找的正则表达式:

好:

"([^"\\]|\\.)*"
版本1:工作正常,但效率不高。

更好:

"([^"\\]++|\\.)*""((?>[^"\\]+)|\\.)*"
版本2:如果您拥有所有格限定词或原子组,则效率更高(请参阅:使用原子组方法的sin的正确答案)。

最好:

"[^"\\]*(?:\\.[^"\\]*)*"
版本3:效率更高。实现Friedl的 “展开循环” 技术。不需要所有格或原子组(即可以在Javascript和其他功能较少的正则表达式引擎中使用。)

这是PHP语法中针对双引号和单引号子字符串的推荐正则表达式:

$re_dq = '/"[^"\\\\]*(?:\\\\.[^"\\\\]*)*"/s';
$re_sq = "/'[^'\\\\]*(?:\\\\.[^'\\\\]*)*'/s";
2020-05-26