用pandas制作武汉疫情数据可视化 选取时间段为该数据集中最早⽇期到4⽉8⽇武汉市解封。主要为了解数据变化,因此选择折线图进⾏绘制。 提取数据为:时间、所有新冠病例、治愈病例、、死亡病例、现存病例 绘制死亡病例、治愈病例、所有病例、现存病例的折线图
时间: 2024-06-08 21:06:25 浏览: 10
首先,需要加载数据并进行预处理,包括选取时间段和提取需要的数据列。可以使用下面的代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
df = pd.read_csv('wh-covid19-data.csv')
# 筛选时间段
start_date = '2020-01-24'
end_date = '2020-04-08'
mask = (df['date'] >= start_date) & (df['date'] <= end_date)
df = df.loc[mask]
# 提取需要的数据列
df = df[['date', 'confirmed', 'cured', 'dead']]
# 计算现存病例
df['existing'] = df['confirmed'] - df['cured'] - df['dead']
```
接下来,可以使用Matplotlib库绘制折线图。可以使用下面的代码:
```python
# 设置图形大小和标题
plt.figure(figsize=(10, 6))
plt.title('COVID-19 in Wuhan')
# 绘制折线图
plt.plot(df['date'], df['dead'], label='Dead')
plt.plot(df['date'], df['cured'], label='Cured')
plt.plot(df['date'], df['confirmed'], label='Confirmed')
plt.plot(df['date'], df['existing'], label='Existing')
# 添加图例和坐标轴标签
plt.legend()
plt.xlabel('Date')
plt.ylabel('Number of Cases')
# 显示图形
plt.show()
```
运行以上代码可以得到一张包含四条折线的图形,分别表示死亡病例、治愈病例、所有病例、现存病例的变化趋势。