我用python脚本下载了一个网页。在大多数情况下,这可以正常工作。
但是,这个有一个响应标头:GZIP编码,当我尝试打印此网页的源代码时,它的腻子中包含所有符号。
如何将其解码为普通文本?
我使用zlib从Web解压缩压缩的内容。
import zlib import urllib f=urllib.request.urlopen(url) decompressed_data=zlib.decompress(f.read(), 16+zlib.MAX_WBITS)