python爬改成utf-8还是乱码
时间: 2023-08-04 16:02:22 浏览: 153
源代码中文乱码==转换为UTF8
如果你在 Python 中爬取的内容出现了乱码,可能是因为网页的编码格式和你的 Python 环境的编码格式不一致导致的。你可以尝试使用 Python 的 `requests` 库来获取网页内容,然后使用 `chardet` 库来检测网页内容的编码格式,最后使用 `decode` 方法将网页内容转换成正确的编码格式。
示例代码如下:
```
import requests
import chardet
url = 'https://www.example.com'
response = requests.get(url)
encoding = chardet.detect(response.content)['encoding']
content = response.content.decode(encoding)
print(content)
```
其中,`response.content` 是获取到的网页内容的二进制格式,`chardet.detect()` 方法可以检测出网页内容的编码格式,`response.content.decode()` 方法将网页内容转换成正确的编码格式。
阅读全文