我正在用 python 编写网络爬虫,它涉及从网站获取标题。
其中一个标题应该是:时尚也来了
但相反,它说:嘻哈音乐也来了
这里出了什么问题?
您需要正确解码源文本。源文本很可能是 UTF-8 格式,而不是 ASCII。
由于您没有提供问题的任何背景或代码,因此无法直接回答。
我建议你研究一下 Unicode 和字符编码在 Python 中是如何完成的:
http://docs.python.org/2/howto/unicode.html