一尘不染

Python Selenium'WebDriver'对象没有属性错误

selenium

我正在尝试从中文网站中抓取一些javascript生成的内容。我正在使用Selenium(和Python),因为我无法直接抓取javascript内容。

# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.selenium import selenium

import time
import urllib2
import httplib
import urllib
import re
import base64

browser = webdriver.Firefox() # Get local session of firefox
browser.get("http://www...") # Load page (redacted here, but any works)
browser.get_body_text() #Attempt to scrape body text

我得到以下错误:

'WebDriver' object has no attribute 'get_body_text'

实际上,我似乎无法在selenium.selenium类中调用任何命令。毫无疑问,我忽略了非常明显的事情。提前致谢。


阅读 571

收藏
2020-06-26

共1个答案

一尘不染

  1. 您只需要from selenium import webdriver
  2. 执行html= browser.find_element_by_xpath(".//html")以获取页面上的html元素(最大的元素)。(您可以通过多种方式执行此操作,并选择任意数量的元素。)
  3. 执行html.text以返回页面文本。

.textelement对象的方法。步骤2是将分配element给名称html

2020-06-26