一尘不染

用于解析网页链接的正则表达式?

html

我正在寻找一个.NET正则表达式来提取网页中的所有URL,但是还没有找到一个足以涵盖指定链接的所有不同方式的URL。

还有一个问题:

是否有 一个正则表达式可以统治所有人 ?还是我最好使用一系列不那么复杂的正则表达式,而只对原始HTML使用多重传递?(速度与可维护性)


阅读 376

收藏
2020-05-10

共1个答案

一尘不染

((mailto\:|(news|(ht|f)tp(s?))\://){1}\S+)

我从regexlib.com获得

[编者注:{1}在此正则表达式中没有实际功能

2020-05-10