我正在使用Python绑定来运行Selenium WebDriver:
from selenium import webdriver wd = webdriver.Firefox()
我知道我可以像这样抓取网络元素:
elem = wd.find_element_by_css_selector('#my-id')
而且我知道我可以通过…获得完整的页面资源
wd.page_source
但是,是否有获得“元素来源”的方法呢?
elem.source # <-- returns the HTML as a string
用于Python的Selenium Webdriver文档基本上不存在,我在代码中看不到任何能够启用该功能的内容。
对访问元素(及其子元素)的HTML的最佳方法有何想法?
您可以读取innerHTML属性以获取元素 内容 的outerHTML来源或包含当前元素的来源。
innerHTML
outerHTML
蟒蛇:
element.get_attribute('innerHTML')
Java:
elem.getAttribute("innerHTML");
C#:
element.GetAttribute("innerHTML");
红宝石:
element.attribute("innerHTML")
JS:
element.getAttribute('innerHTML');
PHP:
$element->getAttribute('innerHTML');
经过测试并与ChromeDriver。
ChromeDriver