一尘不染

Selenium Webdriver和Unicode

selenium

这是我使用Selenium 2库的第二天,Unicode的痛苦似乎从未消退。

我只是在做最基本的操作,想打印页面源代码:

from selenium import webdriver


driver = webdriver.Firefox()
driver.get("http://google.com")

print driver.page_source

果然,我得到一个错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045:  
ordinal not in range(128)

我如何将此编码为utf-8


阅读 303

收藏
2020-06-26

共1个答案

一尘不染

根据这个类似的问题,您可以选择。

您可以将源转换为在此过程中丢失Unicode字符的所有ascii。

(driver.page_source).encode('ascii', 'ignore')

或者,我认为您会更喜欢这种方式,可以将其编码为utf-8,如下所示: (driver.page_source).encode('utf-8')

2020-06-26