一个简单的问题:c#、. net中 的单词字符的模式是什么\w?
\w
我首先想到的是它匹配[A-Za-z0-9_]并且文档告诉我:
[A-Za-z0-9_]
**字符类别描述模式匹配** \ w匹配任何\ w“ I”,“ D”,“ A”,“ 1”,“ 3” 文字字符。在“ ID A1.3”中
这不是很有帮助。 并且\w似乎也匹配äöü。还有什么?有更好的(精确)定义吗?
äöü
从文档中:
文字字元:\ w \w匹配任何单词字符。单词字符是下表列出的任何Unicode类别的成员。 Ll (小写字母) Lu (大写字母) Lt (字母,标题) Lo (其他) Lm (字母,修饰符) Nd (数字,十进制数字) Pc (标点,连接器) 此类别包括十个字符,其中最常用的是LOWLINE字符(_),即u + 005F。 如果指定了ECMAScript兼容行为,\w则等效于[a-zA-Z_0-9]。
\w匹配任何单词字符。单词字符是下表列出的任何Unicode类别的成员。
Ll
Lu
Lt
Lo
Lm
Nd
Pc
如果指定了ECMAScript兼容行为,\w则等效于[a-zA-Z_0-9]。
[a-zA-Z_0-9]