首页python企业微博爬取

python企业微博爬取

时间: 2023-10-06 09:05:53 浏览: 102

新浪微博用户数据爬取（Python实现）

Python爬虫实现功能：连续爬取一个或多个新浪微博用户（如Dear-迪丽热巴、郭碧婷）的数据，并将结果信息写入文件。写入信息几乎包括了用户微博的所有数据，主要有用户信息和微博信息两大类，前者包含用户昵称、关注数、粉丝数、微博数等等；后者包含微博正文、发布时间、发布工具、评论数等等。

Python企业微博爬取是通过使用weibo_spider库来实现的。可以使用以下命令来启动爬虫： $ python3 -m weibo_spider --config_path="config.json" 在进行爬取之前，需要登录到一个微博账号。但是需要注意，不能使用爬虫微博的user_id作为待爬取的user_id，因为爬虫微博无法爬取自己的微博信息。如果需要爬取其他用户的微博信息，可以参考获取其他用户的微博信息。 weibo_spider库有两个版本，你现在看到的是Python 3版，另一个是Python 2版，Python 2版位于python2分支。目前主要开发和bug修复都是在Python 3版上进行，而Python 2版只提供bug修复。建议Python 3用户使用当前版本，而Python 2用户使用Python 2版。

阅读全文