首页用上面的代码爬取网页评论和作者名字时，为什么输出为空？

用上面的代码爬取网页评论和作者名字时，为什么输出为空？

时间: 2024-04-18 20:30:48 浏览: 91

python爬虫爬网页部分内容空白，但源码可以看到，已解决

5星 · 资源好评率100%

曾尝试各种方法，没有效果。使用的是函数requests.get()，已写header、cookie、User-Agent，也写了rsp.encoding = rsp.apparent_encoding。但是仍是爬取不了。奇怪的同一个网站同一个榜单，只是页数不同，前若干页能爬取，后若干页就爬取不了，一度怀疑是不允许爬。最后终于发现原因！因为Cookie找错了（kao！！！！！）注意要用这里的cookie！（下图是Chrome的开发者工具视图）用requests.get()的标准格式：【仅为个人总结】 # 伪装成浏览器，防止封ip headers = { 'User

在你提供的代码中，使用了xpath语法来提取网页中的评论内容和作者名字。然而，根据你提供的代码和网页链接，我注意到可能存在以下几个问题导致输出为空： 1. xpath表达式不正确：请确保xpath表达式与网页的实际结构匹配。可以使用Chrome浏览器的开发者工具来检查网页的HTML结构，并编写准确的xpath表达式。 2. 网页内容加载问题：有些网页内容可能是通过JavaScript动态生成的，而requests库无法执行JavaScript。这种情况下，你可以考虑使用Selenium库来模拟浏览器行为，或者找到API接口来获取数据。 3. 网页反爬机制：有些网站会设置反爬机制，阻止爬虫程序访问网页。你可以尝试添加更多的请求头信息，如Referer、Cookie等，并使用代理IP来解决这个问题。请检查以上问题，并对代码进行适当的调整。如果问题仍然存在，请提供更多的信息和代码细节，以便我能够更好地帮助你解决问题。

阅读全文

最新推荐

Python爬取数据保存为Json格式的代码示例

用上面的代码爬取网页评论和作者名字时，为什么输出为空？

相关推荐

Python爬取数据保存为Json格式的代码示例

python爬取网页转换为PDF文件

零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？

Python爬取微博评论代码

爬取京东评论。代码

爬取网页正文

python 爬取网页

关于使用C#爬取网页中的邮箱地址的代码

java 并行爬取网页

jsoup爬取网页数据

jsoup分页爬取网页

python爬取网页图片

.net 爬取网页数据

puppeteersharp爬取网页数据

Python爬取网页内容

python 使用基础requests 去爬取网页上面的图片并下载

JAVA写的网页爬取代码

用python爬取网页并导出为word文档.docx

最新推荐

Python爬取数据保存为Json格式的代码示例

用python爬取网页并导出为word文档.docx

易语言爬取网页内容方法

详解Java两种方式简单实现：爬取网页并且保存

python 爬取马蜂窝景点翻页文字评论的实现

高清艺术文字图标资源，PNG和ICO格式免费下载

管理建模和仿真的文件

DMA技术：绕过CPU实现高效数据传输

SGM8701电压比较器如何在低功耗电池供电系统中实现高效率运作？

mui框架HTML5应用界面组件使用示例教程