一尘不染

.net正则表达式:字符\ w是什么?

c#

一个简单的问题:c#、. net中
的单词字符的模式是什么\w

我首先想到的是它匹配[A-Za-z0-9_]并且文档告诉我:

**字符类别描述模式匹配**
\ w匹配任何\ w“ I”,“ D”,“ A”,“ 1”,“ 3”
                   文字字符。在“ ID A1.3”中

这不是很有帮助。
并且\w似乎也匹配äöü。还有什么?有更好的(精确)定义吗?


阅读 457

收藏
2020-05-19

共1个答案

一尘不染

文档中

文字字元:\ w

\w匹配任何单词字符。单词字符是下表列出的任何Unicode类别的成员。

  • Ll (小写字母)
  • Lu (大写字母)
  • Lt (字母,标题)
  • Lo (其他)
  • Lm (字母,修饰符)
  • Nd (数字,十进制数字)
  • Pc (标点,连接器)
    • 此类别包括十个字符,其中最常用的是LOWLINE字符(_),即u + 005F。

如果指定了ECMAScript兼容行为,\w则等效于[a-zA-Z_0-9]

也可以看看

2020-05-19