Selenium Webdriver和Unicode

一尘不染

selenium

这是我使用Selenium 2库的第二天，Unicode的痛苦似乎从未消退。

我只是在做最基本的操作，想打印页面源代码：

from selenium import webdriver


driver = webdriver.Firefox()
driver.get("http://google.com")

print driver.page_source

果然，我得到一个错误：

UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045:  
ordinal not in range(128)

我如何将此编码为utf-8？

阅读 303

2020-06-26

共1个答案

一尘不染

根据这个类似的问题，您可以选择。

您可以将源转换为在此过程中丢失Unicode字符的所有ascii。

(driver.page_source).encode('ascii', 'ignore')

或者，我认为您会更喜欢这种方式，可以将其编码为utf-8，如下所示： (driver.page_source).encode('utf-8')。

2020-06-26