爬取关注列表中微博账号的代码实现
时间: 2023-10-10 08:15:04 浏览: 84
以下是使用Python的示例代码,可以爬取一个用户的关注列表,并提取关注列表中微博账号的用户名和ID:
```python
import requests
import json
# 用户UID
uid = '123456789'
# 获取用户关注列表
url = f'https://api.weibo.com/2/friendships/friends.json?uid={uid}&count=200'
response = requests.get(url)
data = json.loads(response.content)
# 提取微博账号的用户名和ID
users = []
for item in data['users']:
user = {
'name': item['screen_name'],
'id': item['id']
}
users.append(user)
print(users)
```
其中,`uid`是用户的UID,可以在微博个人主页的网址中找到。`count`参数指定返回的每页关注列表的数量,最大值为200。在示例代码中,我们使用了`requests`库发送HTTP请求,并使用`json`库解析返回的JSON数据。最后,我们提取了每个关注用户的用户名和ID,并将其保存在一个字典列表中。
相关问题
python爬取微博含有关键词微博代码
Python 爬虫可以很方便地抓取微博的数据,下面介绍一下针对含有关键词微博的代码流程:
1. 安装相关模块
首先,我们需要安装一些必要的 Python 模块,如 requests、beautifulsoup4、selenium、pandas等。
2. 登录微博账号
我们需要登录微博账号来获取数据,可以使用 Selenium 自动模拟登录。
3. 模拟搜索关键词
在搜索框中输入关键字并点击搜索按钮后,会跳转到包含搜索结果的页面,我们可以使用 Selenium 或 requests 模拟搜索结果页面的访问,并获取网页内容。
4. 解析网页内容
我们可以使用 Beautiful Soup 对网页内容进行解析,通过查找相应的 HTML 标签获取微博的相关信息,如微博内容、点赞数、评论数、转发数等。
5. 存储数据
将解析出的微博信息存储到本地文件中或数据库中,以便后续分析使用。
以上就是使用 Python 爬虫实现微博关键词搜索的主要流程。需要注意的是,微博已经对爬虫进行了限制和防范措施,因此需要遵守相应的爬虫规范,不要过度爬取和频繁访问。
微博爬取关注用户的关注情况代码
这里提供一个使用 Python 和微博 API 进行爬取关注用户的关注情况的示例代码:
```python
import requests
import json
# 微博 API 的请求地址和参数
url = 'https://api.weibo.com/2/friendships/friends.json'
params = {
'access_token': 'YOUR_ACCESS_TOKEN', # 替换成你自己的 access_token
'uid': 'FOLLOWER_UID', # 要爬取的关注用户的 UID
'count': 200, # 每次请求获取的关注用户数
'cursor': 0 # 分页游标,初始值为 0
}
# 爬取所有关注用户的关注情况
followings = []
while True:
# 发送请求获取响应数据
response = requests.get(url, params=params)
data = json.loads(response.text)
if data.get('error'):
print(data.get('error'))
break
# 解析响应数据,获取每个关注用户的 UID 和关注数
users = data.get('users', [])
for user in users:
following = {'uid': user.get('id'), 'follow_cnt': user.get('friends_count')}
followings.append(following)
# 更新分页游标,如果已经到最后一页,则退出循环
next_cursor = data.get('next_cursor', 0)
if next_cursor == 0:
break
params['cursor'] = next_cursor
# 输出所有关注用户的关注情况
for following in followings:
print(following)
```
需要注意的是,使用微博 API 进行爬取需要先申请开发者账号,创建应用并获取 access_token。另外,微博 API 有一定的访问频率限制,请不要过于频繁地发送请求。
阅读全文