一尘不染

Selenium Webdriver:如何找到元素的所有属性?

selenium

在Python Selenium模块中,一旦有了WebElement对象,我可以使用以下命令获取其任何属性的值get_attribute()

foo = elem.get_attribute('href')

如果命名的属性'href'不存在,None则返回。

我的问题是,如何获取元素具有的所有属性的列表?似乎没有get_attributes()get_attribute_names()方法。

我正在为Python使用Selenium模块的2.44.0版本。


阅读 1140

收藏
2020-06-26

共1个答案

一尘不染

这是 不可能的 使用硒webdriver的API,但你可以_执行JavaScript代码_来获取所有属性:

driver.execute_script('var items = {}; for (index = 0; index < arguments[0].attributes.length; ++index) { items[arguments[0].attributes[index].name] = arguments[0].attributes[index].value }; return items;', element)

演示:

>>> from selenium import webdriver
>>> from pprint import pprint
>>> driver = webdriver.Firefox()
>>> driver.get('https://stackoverflow.com')
>>> 
>>> element = driver.find_element_by_xpath('//div[@class="network-items"]/a')
>>> attrs = driver.execute_script('var items = {}; for (index = 0; index < arguments[0].attributes.length; ++index) { items[arguments[0].attributes[index].name] = arguments[0].attributes[index].value }; return items;', element)
>>> pprint(attrs)
{u'class': u'topbar-icon icon-site-switcher yes-hover js-site-switcher-button js-gps-track',
 u'data-gps-track': u'site_switcher.show',
 u'href': u'//stackexchange.com',
 u'title': u'A list of all 132 Stack Exchange sites'}

为了完整起见,一种替代解决方案是获取标记outerHTML并使用HTML解析器解析属性。示例(使用BeautifulSoup):

>>> from bs4 import BeautifulSoup
>>> html = element.get_attribute('outerHTML')
>>> attrs = BeautifulSoup(html, 'html.parser').a.attrs
>>> pprint(attrs)
{u'class': [u'topbar-icon',
            u'icon-site-switcher',
            u'yes-hover',
            u'js-site-switcher-button',
            u'js-gps-track'],
 u'data-gps-track': u'site_switcher.show',
 u'href': u'//stackexchange.com',
 u'title': u'A list of all 132 Stack Exchange sites'}
2020-06-26