import pandas as pd # 分级标准 aqi_level = [(0, 50), (51, 100), (101, 150), (151, 200), (201, 300), (301, 500)] level_name = ['优', '良', '轻度污染', '中度污染', '重度污染', '严重污染'] df = pd.read_csv('空气质量.csv', encoding='utf-8-sig') # 将AQI按等级进行分类 df['AQI_level'] = pd.cut(df['AQI'], bins=[level[0] for level in aqi_level] + [aqi_level[-1][-1]], labels=level_name, right=False) # 合并数据 result = pd.concat([df['城市'], df['AQI_level']], axis=1) # 计算每个等级的城市数量 count = result.groupby('AQI_level').size() # 输出结果 print(count)
时间: 2024-01-12 07:04:50 浏览: 144
这段代码的作用是读取一个名为“空气质量.csv”的数据文件,将其中的AQI数据按照一定的标准进行分级,并统计各级别城市的数量,最后输出结果。具体来说,代码中:
- 第1行加载了pandas库,以便进行数据处理。
- 第2行定义了一个列表aqi_level,其中每个元素都是一个二元组,代表一个AQI等级的范围。
- 第4行使用pandas的read_csv函数读取了“空气质量.csv”文件,并将其存储在名为df的数据框中。
- 第7行使用pandas的cut函数将AQI数据按照等级进行分类,并将结果存储在名为AQI_level的一列中。
- 第10行使用pandas的concat函数将城市和AQI等级两列合并为一个数据框。
- 第13行使用pandas的groupby函数按照AQI等级进行分组,并统计每个等级的城市数量。
- 第16行输出结果。
阅读全文