Python-提取正则表达式匹配项的一部分

一尘不染

python

我想要一个正则表达式从HTML页面提取标题。目前我有这个：

title = re.search('<title>.*</title>', html, re.IGNORECASE).group()
if title:
    title = title.replace('<title>', '').replace('</title>', '')

是否有一个正则表达式仅提取<title>的内容，所以我不必删除标签？

阅读 961

2020-02-23

共1个答案

一尘不染

用( )在正则表达式和group(1)python中检索捕获的字符串（re.search将返回None如果没有找到结果，所以不要用group()直接）：

title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE)

if title_search:
    title = title_search.group(1)

2020-02-23