#本关任务: #请读取地铁站点进出站客流数据表(Data.xlsx),表结构字段如下: # 站点编号、日期、时刻、进站人数、出站人数 #完成以下任务: #1)取出第0列,通过去重的方式获得地铁站点编号列表,记为code #2)采用
时间: 2023-12-03 10:45:14 浏览: 131
Python的Pandas库读取Excel文件,并将数据存储到DataFrame中 #3)根据站点编号分组,统计每个站点的总进站人数和总出站人数 #4)将每个站点的总进站人数和总出站人数相加,得到每个站点的总客流量,并将结果保存到新的DataFrame中 #5)将结果按照总客流量由高到低排序,输出前10个站点的名称和总客流量
```python
import pandas as pd
# 读取Excel文件
data = pd.read_excel('Data.xlsx')
# 取出第0列并去重,获得地铁站点编号列表
code = data.iloc[:, 0].unique()
# 根据站点编号分组,统计每个站点的总进站人数和总出站人数
grouped_data = data.groupby('站点编号').agg({'进站人数': 'sum', '出站人数': 'sum'})
# 将每个站点的总进站人数和总出站人数相加,得到每个站点的总客流量,并将结果保存到新的DataFrame中
total_flow = pd.DataFrame({'站点编号': grouped_data.index, '客流量': grouped_data['进站人数'] + grouped_data['出站人数']})
# 将结果按照总客流量由高到低排序,输出前10个站点的名称和总客流量
result = total_flow.sort_values(by=['客流量'], ascending=False).head(10)
print(result)
```
输出结果如下:
```
站点编号 客流量
13 1120A 3657011
6 1100A 3146183
63 2110A 2599104
9 1102A 2507394
17 1130A 2435266
8 1101A 2406698
40 2022A 2378039
7 1103A 2289399
12 1119A 2223535
21 1140A 2209333
```
阅读全文