# 按日期对累计患病人数统计 grouped_time_cases = df_data.groupby('Date_reported')['Cumulative_cases'].sum() plt.plot(grouped_time_cases.index, grouped_time_cases.values) plt.xlabel('Date_reported') plt.ylabel('Cumulative_cases') plt.title('Cumulative case toll by date') # 显示图表 plt.show()这个代码分组后图片x轴顺序有问题如何解决
时间: 2024-02-05 18:04:21 浏览: 24
如果你的 x 轴顺序有问题,可以尝试按日期对数据进行排序,然后再绘制图表。你可以使用 Pandas 的 sort_values() 函数来实现这一点,代码如下:
```python
grouped_time_cases = df_data.groupby('Date_reported')['Cumulative_cases'].sum()
grouped_time_cases = grouped_time_cases.sort_values(by='Date_reported')
plt.plot(grouped_time_cases.index, grouped_time_cases.values)
plt.xlabel('Date_reported')
plt.ylabel('Cumulative_cases')
plt.title('Cumulative case toll by date')
plt.show()
```
在这里,我们使用 sort_values() 对 `grouped_time_cases` 按照 'Date_reported' 列进行排序,然后将排序后的结果用于绘制图表。这样就可以确保 x 轴按照日期的顺序排列了。
相关问题
grouped = df.groupby(cols_to_group).size().reset_index(name='count')
好的,您的问题是:这段代码的作用是什么?
这段代码的作用是对数据表 df 进行按照指定列进行分组,并统计每组的数量,最后将结果保存在名为 "grouped" 的表格中。具体来说,代码中的"cols_to_group"是用于指定需要进行分组的列名。同时,reset_index(name='count') 可以将结果中的 index 重置并指定新的列名为 "count"。
index = pd.MultiIndex.from_product([Order_df['Arrive_step'].unique(), Order_df['Pickup_Zone'].unique(), Order_df['Dropoff_Zone'].unique()], names=['Arrive_step', 'Pickup_Zone', 'Dropoff_Zone']) grouped_Travel_time = Order_df.groupby(['Arrive_step', 'Pickup_Zone', 'Dropoff_Zone'])['Travel_time'].mean().reindex(index, fill_value=Order_df.groupby(['Pickup_Zone', 'Dropoff_Zone'])['Travel_time'].mean()) grouped_Travel_time grouped_Travel_time.to_csv('./Data/grouped_Travel_time_20150114.csv')
这段代码使用了 Python 中的 Pandas 库,通过对 Order_df 数据集进行分组和处理,得到了一个多层次索引的数据表 grouped_Travel_time,并将其保存为 CSV 文件。其中,通过 pd.MultiIndex.from_product() 方法生成了一个由 Arrive_step、Pickup_Zone 和 Dropoff_Zone 三个变量构成的多层次索引,然后使用 groupby() 方法对这些变量进行分组,并计算 Travel_time 的平均值,最后使用 reindex() 方法将得到的结果根据多层次索引进行重构,同时使用 fill_value 参数指定了当某些组合不存在时,使用另一个分组的平均值进行填充。最后将得到的数据表使用 to_csv() 方法保存为 CSV 文件。