Percy

使用正则表达式匹配utf-8编码中的任何中文字符

java

例如,我想匹配组成的字符串m来n中国的字符,然后我可以使用:

[single Chinese character regular expression]{m,n}

是否存在单个汉字的某些正则表达式,可能是存在的任何汉字?


阅读 394

收藏
2020-12-06

共1个答案

一尘不染

与中文(好吧,CJK)字符匹配的正则表达式为

\p{script=Han}

可以简化为

\p{Han}

这假定您的正则表达式编译器满足UTS#18 Unicode正则表达式的RL1.2属性要求。Perl和Java 7都符合该规范,但其他许多不符合。

2020-12-06