一尘不染

如何在单引号和双引号PHP正则表达式模式中正确地转义反斜杠以匹配文字反斜杠

php

为了匹配文字上的反斜杠,许多人和PHP手册都说:总是这样对它进行三倍转义\\\\

注意事项

单引号和双引号的PHP字符串具有反斜杠的特殊含义。因此,如果\必须与正则表达式匹配\\,则必须在PHP代码中使用"\\\\"'\\\\'

这是一个示例字符串: \test

$test = "\\test"; // outputs \test;

// WON'T WORK: pattern in double-quotes double-escaped backslash
#echo preg_replace("~\\\t~", '', $test); #output -> \test

// WORKS: pattern in double-quotes with triple-escaped backslash
#echo preg_replace("~\\\\t~", '', $test); #output -> est

// WORKS: pattern in single-quotes with double-escaped backslash
#echo preg_replace('~\\\t~', '', $test); #output -> est

// WORKS: pattern in double-quotes with double-escaped backslash inside a character class
#echo preg_replace("~[\\\]t~", '', $test); #output -> est

// WORKS: pattern in single-quotes with double-escaped backslash inside a character class
#echo preg_replace('~[\\\]t~', '', $test); #output -> est

结论

  • 如果模式是单引号,则必须将双反斜杠转义\\\以匹配文字\
  • 如果模式被双引号引起,则取决于反冲是否在字符类内部,在该字符级中必须至少将其两次转义,而必须将\\\ 其三倍转义\\\\

谁能给我带来不同呢?单引号中的双转义反斜杠'~\\\~'会匹配双引号中的三转义反斜杠,例如匹配"~\\\\~"或失败。

何时/为什么/在什么情况下使用\单引号引起来的双转义是错误的,例如'~\\\~'用于匹配文字反斜杠?

如果这个问题没有答案,我将继续\\\在单引号的PHP regex模式中始终使用双转义的反斜杠来匹配文字,\因为它可能没有问题。


阅读 574

收藏
2020-05-29

共1个答案

一尘不染

\PHP的解析器和正则表达式引擎(PCRE)都将反斜杠字符()视为转义字符。如果编写单个反斜杠字符,则PHP解析器会将其视为转义字符。如果编写两个反斜杠,则PHP的解析器会将其解释为文字反斜杠。但是,当在正则表达式中使用时,正则表达式引擎会将其用作转义字符。为了避免这种情况,您需要根据引用模式的方式编写四个反斜杠字符。

要了解两种类型的引用模式之间的区别,请考虑以下两个var_dump()语句:

var_dump('~\\\~');
var_dump("~\\\\~");

输出:

string(4) "~\\~"
string(4) "~\\~"

\~在单引号字符串中使用转义序列时,在PHP中没有特殊含义。三个反斜杠也可以,因为PHP解析器不知道转义顺序\~。因此\\将成为\\~将保持不变\~

您应该使用哪一个:

为了清楚起见,我总是~\\\\~在想要匹配文字反斜杠时使用。另一个也可以,但是我认为~\\\\~更加清楚。

2020-05-29