首页为什么我爬虫获取的是这样的编码 \xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab

为什么我爬虫获取的是这样的编码 \xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab

时间: 2023-06-29 14:19:59 浏览: 144

跟老齐学Python之坑爹的字符编码

字符编码，在编程中，是一个让学习者比较郁闷的东西，比如一个str，如果都是英文，好说多了。但恰恰不是如此，中文是我们不得不用的。所以，哪怕是初学者，都要了解并能够解决字符编码问题。 >>> name = '老齐' >>> name '\xe8\x80\x81\xe9\xbd\x90' 在你的编程中，你遇到过上面的情形吗？认识最下面一行打印出来的东西吗？看人家英文，就好多了 >>> name = qiwsir >>> name 'qiwsir' 难道这是中文的错吗？看来投胎真的是一个技术活。是的，投胎是技术活，但上面的问题不是中文的错。编码什么是编码？这是一个比较玄乎的问题。也不

这是因为你获取到的内容是经过编码的，需要进行解码才能正常显示中文字符。`\xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab` 实际上是 UTF-8 编码下的“九流术士”。在 Python 中，可以使用 `decode()` 方法将编码的字符串解码为 Unicode 字符串。例如： ```python content = b'\xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab' decoded_content = content.decode('utf-8') print(decoded_content) ``` 输出结果为： ``` 九流术士 ``` 当然，如果你使用了第三方库如 `requests` 或 `beautifulsoup4` 等，这些库在获取内容时已经自动进行了解码，一般情况下不需要手动进行解码。

阅读全文

最新推荐

为什么我爬虫获取的是这样的编码 \xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab

相关推荐

ST75263S: 208x81单色点阵液晶显示器驱动器/控制器数据手册

自制ASCII减法编码器助力CTP/OSCE认证

\xe4\xb9\x9d\xe6\xb5\x81\xe6\x9c\xaf\xe5\xa3\xab 是什么

url转义 \xe8\xb4\x9f\xe5\x8e\x8b\xe7\x90\x83\xef\xbc\x9a200ml\xef\xbc\x9b\xe5\xbc\x95\xe6\xb5\x81\xe6\x9d\xa1\xef\xbc\x9a\xe4\xb8\xad

hbase过滤后value=\xE4\xB8\x8A\xE6\xB5\xB7\xE9\xBE\x99\xE7\xA5\xA5\xE9\xA3\x9F\xE5\x93\x81\xE6\x9C\x89\x

FileNotFoundError: File b'\xe5\xae\x81\xe6\xb3\xa2\xe9\x93\xb6\xe8\xa1\x8c\xef\xbc\x9a2009\xe5\xb9\xb4\xe5\xb9\xb4\xe5\xba\xa6\xe6\x8a\xa5\xe5\x91\x8a.txt' does not exist

list内多个中文乱码b'\xe5\x88\x9d\xe4\xbe\xa7\xe7\xba\xbf\xe6\x8a\xbd\xe5\x87\xba\xe6\xb5\x81\xe9\x87\x8f'编码转化

URL \xe5\x9b\xbd\xe5\xae\xb6\xe6\xa0\x87\xe5\x87\x86\xe7\xbc\x96\xe7\xa0\x81_\xe5\xba\x8f\xe5\x8f\xb7

URL转义 \xe5\x9b\xbd\xe5\xae\xb6\xe6\xa0\x87\xe5\x87\x86\xe7\xbc\x96\xe7\xa0\x81_\xe5\xba\x8f\xe5\x8f\xb7

360WiFi\xef\xbd\x9e\xe5\xbe\xb7\xe4\xbd\xb3\xe5\xae\xb6\xef\xbc\x81转字符串

\xe9\x97\xae\xe7\xad\x94\xe4\xbf\xa1\xe6\x81\xaf\xe8\xae\xb0\xe5\xbd\x95\xe6\x88\x90\xe5\x8a\x9f\xef\xbc\x81 给转换为中文

‘\xe4\xbb\x81\xe5\xaf\xbf\xe5\x8e\xbf\xe6\xb8\x85\xe6\xb0\xb4\xe9\x95\x87转为UTF8

\xe9\xb9\xbf\xe7\x81\xb5\xe5\xae\x88\xe5\xbf\x83 转 Unicode

'\xe5\x85\xa5\xe8\x81\x8c\xe6\x97\xa5\xe6\x9c\x9f'

java 将 Python 的\xe9\xb9\xbf\xe7\x81\xb5\xe5\xae\x88\xe5\xbf\x83 解码

我的treelib，tree.show()输出的是b'\xe4\xb8\xaa\xe4\xba\xba\xe4\xbf\xa1\xe6\x81\xaf\n\xe2\x94\x9c\xe2\x94\x80\xe2\x9，如何让其正常输出中文

'\xe9\xb9\xbf\xe7\x81\xb5\xe5\xae\x88\xe5\xbf\x83' 怎么通过java 转成中文

最新推荐

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"

【单片机编程实战】：掌握流水灯与音乐盒同步控制的高级技巧

java 号码后四位用‘xxxx’脱敏

Arachne:实现UDP RIPv2协议的Java路由库

关系数据表示学习