根据最新的数据,将统计数据划分为:(0, 1000]、(1000, 5000]、(5000,10000]、(10000,50000]、(50000, 100000]、(100000,200000]、(200000,500000]、(500000,1000000]、(1000000,5000000]等若干个区间,分别统计各个区间的Country/Region数目,数据地址C:\\Users\\86155\\Desktop\\JupyterCode代码\\practice_16\\time_series_covid19_confirmed_global.csv。
时间: 2024-02-28 09:55:19 浏览: 92
Boss 直聘JD10000条 用于ELK分析使用
好的,您可以使用以下代码实现您的需求:
```python
import pandas as pd
# 读取数据
data = pd.read_csv(r'C:\Users\86155\Desktop\JupyterCode代码\practice_16\time_series_covid19_confirmed_global.csv')
# 按照 Country/Region 分组,计算每个分组的总和
grouped_data = data.groupby('Country/Region').sum()
# 划分区间
bins = [0, 1000, 5000, 10000, 50000, 100000, 200000, 500000, 1000000, 5000000]
labels = ['(0, 1000]', '(1000, 5000]', '(5000,10000]', '(10000,50000]', '(50000, 100000]', '(100000,200000]', '(200000,500000]', '(500000,1000000]', '(1000000,5000000]']
grouped_data['区间'] = pd.cut(grouped_data['3/28/20'], bins=bins, labels=labels)
# 统计各个区间的 Country/Region 数目
result = grouped_data.groupby('区间')['3/28/20'].count()
print(result)
```
这段代码会读取指定路径下的 csv 文件,按照 Country/Region 分组,计算每个分组的总和。接着,将数据划分为指定的区间,并统计每个区间内的 Country/Region 数目。最后输出结果。
阅读全文