这是我使用Selenium 2库的第二天,Unicode的痛苦似乎从未消退。
我只是在做最基本的操作,想打印页面源代码:
from selenium import webdriver driver = webdriver.Firefox() driver.get("http://google.com") print driver.page_source
果然,我得到一个错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045: ordinal not in range(128)
我如何将此编码为utf-8?
utf-8
根据这个类似的问题,您可以选择。
您可以将源转换为在此过程中丢失Unicode字符的所有ascii。
(driver.page_source).encode('ascii', 'ignore')
或者,我认为您会更喜欢这种方式,可以将其编码为utf-8,如下所示: (driver.page_source).encode('utf-8')。
(driver.page_source).encode('utf-8')