一尘不染

移除Python HTML

python

如何从Python的字符串中删除所有HTML?例如,我该如何转向:

blah blah <a href="blah">link</a>

进入

blah blah link

谢谢!


阅读 259

收藏
2021-01-20

共1个答案

一尘不染

您可以使用正则表达式删除所有标签:

>>> import re
>>> s = 'blah blah <a href="blah">link</a>'
>>> re.sub('<[^>]*>', '', s)
'blah blah link'
2021-01-20