首页请优化上述代码，使其print出的不是乱码

请优化上述代码，使其print出的不是乱码

时间: 2024-11-23 21:49:43 浏览: 5

如果你遇到打印结果为乱码的情况，可能是编码问题导致的。在Python中处理字符串编码时，需要确保输入和输出的编码格式一致。如果网页返回的是非UTF-8编码的数据，你需要手动设置相应的解码器。以下是修改后的代码，添加了解码步骤： ```python import requests from bs4 import BeautifulSoup import chardet # 需要安装此库用于检测字符集，使用pip install chardet def detect_encoding(response): encoding = chardet.detect(response.content)['encoding'] return encoding url = "https://www.ctbu.edu.cn/index/xxxw.htm" response = requests.get(url) encoding = detect_encoding(response) # 检测并确定编码 if response.status_code == 200: try: # 尝试设置正确的编码解析HTML response_text = response.text.decode(encoding) soup = BeautifulSoup(response_text, 'html.parser') h4_nodes = soup.find_all('h4') p_nodes = soup.find_all('p') for node in h4_nodes + p_nodes: print(f"标签: {node.name}, 内容: {node.text.strip()}") except UnicodeDecodeError as e: print("编码错误:", str(e)) else: print(f"无法加载页面，状态码: {response.status_code}")

阅读全文

最新推荐

Apache RocketMQ Go客户端：全面支持与消息处理功能

请优化上述代码，使其print出的不是乱码

相关推荐

web-print-code.rar_php_php 打印_web print_web 打印_webprint a

py源码实例自动办公一键抓出PPT中的所有文字

如何解决JSP页面显示乱码问题

Jupyter Notebook中文乱码问题解决方案

解决Java乱码之谜：Charset类在字符编码中的8个应用案例

【邮件内容国际化处理】：解决邮件编码与乱码问题（提升国际沟通效率）

Java性能优化秘传：字节数组打印的10大优化技巧

优化Python写入CSV文件的速度与效率

字符串拼接的最佳实践与性能优化

使用Git Diff比较文件或代码的差异

使用机器学习技术优化网络爬虫的数据处理

【htmlentitydefs深度解析】：源码解读与优化建议

【htmlentitydefs进阶技巧】：性能优化与常见错误避免

【htmlentitydefs最佳实践】：编写可维护的代码

Python字符串性能优化术：速度与优雅的完美结合

Python JSON数据处理：Web开发中的应用与优化技巧

Python Pango性能优化：专家级文本渲染与界面布局技巧

sgmllib数据结构与优势详解：优化你的Python数据解析

Java字符串到数组的转换：掌握最佳代码实践

Java内存中字符集操作效能提升：Charset类的优化技巧

最新推荐

python3使用print打印带颜色的字符串代码实例

bootstrap PrintThis打印插件使用详解

读写json中文ASCII乱码问题的解决方法

vue中使用vue-print.js实现多页打印

javascript实现window.print()去除页眉页脚

Raspberry Pi OpenCL驱动程序安装与QEMU仿真指南

管理建模和仿真的文件

Fluent UDF实战攻略：案例分析与高效代码编写

如何使用DPDK技术在云数据中心中实现高效率的流量监控与网络安全分析？

Apache RocketMQ Go客户端：全面支持与消息处理功能