python压缩网页源码
时间: 2023-05-16 22:03:33 浏览: 145
python获取网页源码,经过伪装,自动判断网页压缩与否
Python中压缩网页源码有多种方法,其中一个常用的是使用gzip库。gzip库是Python内置的压缩和解压缩库,可以用来对文本文件和字节流进行压缩和解压缩操作。下面是一个使用gzip库压缩网页源码的示例代码:
```python
import gzip
import requests
# 获取网页源码
url = 'https://www.example.com'
response = requests.get(url)
html = response.text
# 使用gzip压缩网页源码
compressed_html = gzip.compress(html.encode())
# 将压缩后的源码保存到文件
with open('example.html.gz', 'wb') as f:
f.write(compressed_html)
```
在上面的代码中,首先使用requests库获取网页的源码,然后将源码使用gzip库进行压缩。压缩后的源码可以通过写入到文件中来存储。如果需要解压缩已经压缩的网页源码,可以使用gzip库的解压缩函数`gzip.decompress()`来进行解压缩操作。
阅读全文