为什么我爬虫获取的是这样的编码 \xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab
时间: 2023-06-29 14:19:59 浏览: 144
跟老齐学Python之坑爹的字符编码
这是因为你获取到的内容是经过编码的,需要进行解码才能正常显示中文字符。`\xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab` 实际上是 UTF-8 编码下的“九流术士”。
在 Python 中,可以使用 `decode()` 方法将编码的字符串解码为 Unicode 字符串。例如:
```python
content = b'\xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab'
decoded_content = content.decode('utf-8')
print(decoded_content)
```
输出结果为:
```
九流术士
```
当然,如果你使用了第三方库如 `requests` 或 `beautifulsoup4` 等,这些库在获取内容时已经自动进行了解码,一般情况下不需要手动进行解码。
阅读全文