按照学校(教育经历字段) 统计粉丝数(‘关注者’)、关注人数(‘关注’),并筛选出粉丝数TOP20的学校,不要求创建函数
时间: 2024-01-09 10:05:10 浏览: 23
您好,根据您的要求,可以通过以下步骤来实现:
1. 使用 Pandas 库读取数据集(假设数据集名为 df)。
```python
import pandas as pd
df = pd.read_csv("your_dataset.csv")
```
2. 对数据集进行初步清洗,剔除缺失值等。
```python
df.dropna(inplace=True) # 剔除缺失值
```
3. 根据学校名称进行分组,并对每组进行聚合统计。
```python
grouped = df.groupby("学校名称").agg({"关注者": "sum", "关注": "sum"})
```
4. 对粉丝数进行倒序排序,并取出前20个学校。
```python
top20 = grouped.sort_values(by="关注者", ascending=False)[:20]
```
5. 打印结果。
```python
print(top20)
```
完整代码如下:
```python
import pandas as pd
# 读取数据集
df = pd.read_csv("your_dataset.csv")
# 剔除缺失值
df.dropna(inplace=True)
# 分组聚合统计
grouped = df.groupby("学校名称").agg({"关注者": "sum", "关注": "sum"})
# 粉丝数倒序排序并取出前20个学校
top20 = grouped.sort_values(by="关注者", ascending=False)[:20]
# 打印结果
print(top20)
```
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)