如何使用BeautifulSoup bs4获取HTML标签的内部文本值？

一尘不染

如何使用BeautifulSoup bs4获取HTML标签的内部文本值？

python

使用BeautifulSoup bs4时，如何从HTML标签内部获取文本？当我运行此行时：

oname = soup.find("title")

我得到这样的title标签：

<title>page name</title>

现在我只想获取其中的内部文本page name，不带标签。怎么做？

阅读 1111

2021-01-20

共1个答案

一尘不染

使用.text从标记中获取文本。

oname = soup.find("title")
oname.text

要不就 soup.title.text

In [4]: from bs4 import BeautifulSoup    
In [5]: import  requests
In [6]: r = requests.get("http://codingdict.com/questions/196612")    
In [7]: BeautifulSoup(r.content).title.text
Out[7]: u'html - How to Retrieve information inside a tag with python - Stack Overflow'

要打开文件并使用文本作为名称，请像使用其他任何字符串一样简单地使用它：

with open(oname.text, 'w') as f

2021-01-20