用python写一个完整的爬虫代码,爬虫可以爬取pc端微博的图片、内容、点赞数、评论数,并将内容、点赞数、评论数保存为xls格式

好的，以下是用 Python 编写的一个微博爬虫脚本，可以爬取 PC 端微博的图片、内容、点赞数、评论数，并将内容、点赞数、评论数保存为 xls 格式： ```python import requests from bs4 import BeautifulSoup import xlwt # 定义要爬取的微博页数 PAGE_NUM = 10 # 创建一个工作簿，并添加一个工作表 workbook = xlwt.Workbook(encoding = 'utf-8') worksheet = workbook.add_sheet('weibo') # 添加表头 worksheet.write(0, 0, '内容') worksheet.write(0, 1, '点赞数') worksheet.write(0, 2, '评论数') # 定义一个变量来记录行数 row_num = 1 # 循环爬取多页微博 for page in range(1, PAGE_NUM+1): # 构造请求的 URL url = 'https://weibo.com/?category=0&page=%d' % page # 发送 HTTP 请求 r = requests.get(url) # 解析 HTML 文档 soup = BeautifulSoup(r.text, 'html.parser') # 获取微博列表 weibos = soup.select('.WB_feed_detail') # 循环处理每一条微博 for weibo in weibos: # 获取微博内容 content = weibo.select('.WB_text')[0].text.strip() # 获取点赞数和评论数 like_count = int(weibo.select('.WB_handle .pos')[0].text.strip()) comment_count = int(weibo.select('.WB_handle .pos')[1].text.strip()) # 获取微博图片 imgs = weibo.select('.WB_media_wrap .WB_pic') img_urls = [] for img in imgs: img_urls.append(img['src']) # 将微博内容、点赞数、评论数写入工作表 worksheet.write(row_num, 0, content) worksheet.write(row_num, 1, like_count) worksheet.write(row_num, 2, comment_count) # 将行数加 1 row_num += 1 # 保存工作簿 workbook.save('weibo.xls') ``` 这个爬虫使用了 requests 库进行 HTTP 请求，使用了 BeautifulSoup 库解析 HTML 文档，并使用了 xlwt 库将数据保存为 xls 格式。你可以在代码中修改 PAGE_NUM 变量来指定要爬取的微博页数，也可以根据需要修改表头和保存的文件名。

阅读全文

用python写一个完整的爬虫代码,爬虫可以爬取pc端微博的图片、内容、点赞数、评论数,并将内容、点赞数、评论数保存为xls格式

相关推荐

详解用python写网络爬虫-爬取新浪微博评论

python爬虫手把手教你抓取微博评论（完整代码）

新浪微博爬虫，用python爬取新浪微博数据，并下载微博图片和微博视频.zip

用python写一个完整的爬虫代码,爬虫可以爬取微博的图片、内容、点赞数、评论数,并将内容、点赞数、评论数保存为xls格式

python爬取微博评论点赞

微博数据爬取demo ,解析微博评论数，点赞数，图片链接等

新浪微博爬虫，用python爬取新浪微博数据，并下载微博图片和微博视频

爬新浪微博内容.py利用Python爬取新浪微博赵丽颖微博内容和评论

基于Python3的微博爬虫项目，含有按关键字和时间进行微博信息爬取、微博用户资料爬取、微博评论爬取等功能 .zip

新浪微博爬虫，用python爬取新浪微博数据

python爬取微博图片及内容

一个简单的python爬虫工具，爬取包含关键词的新浪微博.zip

【python爬虫】Python图片爬虫爬取Lofter图片.zip

简易爬虫教程：如何用Python爬取新浪微博数据

Python爬虫实战：免登陆爬取微博评论并生成词云

Python爬虫实战：如何爬取和分析新浪微博数据

Python爬虫技巧：微博信息爬取与图片下载

python爬取微博评论_详解用python写网络爬虫-爬取新浪微博评论

python爬虫爬取微博评论

大家在看

STM32的FOC库教程

2000-2022年 上市公司-股价崩盘风险相关数据（数据共52234个样本，包含do文件、excel数据和参考文献）.zip

Mac OS X10.6.3 Snow Leopard系统 中文版完整安装盘 下载地址连接

SigmaStudioHelp_3.0(中文)

涉密网络建设方案模板.doc

最新推荐

Python3简单爬虫抓取网页图片代码实例

基于python的百度迁徙迁入、迁出数据爬取（爬虫大数据）（附代码）

python爬虫框架scrapy实战之爬取京东商城进阶篇

Python爬取当当、京东、亚马逊图书信息代码实例

python制作爬虫并将抓取结果保存到excel中

PHP集成Autoprefixer让CSS自动添加供应商前缀

揭秘数字音频编码的奥秘：非均匀量化A律13折线的全面解析

arduino PAJ7620U2

网站啄木鸟：深入分析SQL注入工具的效率与限制

【GPStoolbox使用技巧大全】：20个实用技巧助你精通GPS数据处理

2000-2022年上市公司-股价崩盘风险相关数据（数据共52234个样本，包含do文件、excel数据和参考文献）.zip

Mac OS X10.6.3 Snow Leopard系统中文版完整安装盘下载地址连接