我正在使用Python绑定来运行Selenium WebDriver。
from selenium import webdriver wd = webdriver.Firefox()
我知道我可以像这样抓取网络元素…
elem = wd.find_element_by_css_selector('#my-id')
而且我知道我可以通过…获得完整的页面资源
wd.page_source
但是无论如何,有没有获得“元素来源”?
elem.source # <-- returns the HTML as a string
Python的Selenium Webdriver文档基本上不存在,我在代码中看不到任何能够启用该功能的东西。
对访问元素(及其子元素)的HTML的最佳方法有何想法?
您可以读取innerHTML属性以获取元素内容的outerHTML来源或包含当前元素的来源。
innerHTML
outerHTML
Python:
element.get_attribute('innerHTML')
Java:
elem.getAttribute("innerHTML");
C#:
element.GetAttribute("innerHTML");
Ruby:
element.attribute("innerHTML")
JS:
element.getAttribute('innerHTML');
PHP:
$element->getAttribute('innerHTML');
经过测试并与ChromeDriver。