survey lung cancer.csv绘制年龄/抽烟情况可视化
时间: 2023-07-07 12:25:47 浏览: 114
好的,您可以使用Python中的Pandas和Matplotlib库来绘制年龄/抽烟情况的可视化。您可以使用柱状图或箱线图来展示这个数据集的分布情况。
以下是两种可视化的代码示例:
1. 柱状图
``` python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv('survey lung cancer.csv')
# 计算不同年龄和抽烟情况的人数
age_smokes_counts = data.groupby(['Age', 'Smokes'])['ID'].count().reset_index()
# 绘制柱状图
fig, ax = plt.subplots(figsize=(10, 6))
age_smokes_counts.pivot(index='Age', columns='Smokes', values='ID').plot(kind='bar', ax=ax)
# 设置图表标题和坐标轴标签
plt.title('Lung Cancer Survey')
plt.xlabel('Age')
plt.ylabel('Counts')
# 显示图表
plt.show()
```
在这个示例中,我们使用了数据集中的Age、Smokes和ID列来计算不同年龄和抽烟情况的人数,并将其展示在柱状图中。其中,pivot函数用于将数据透视为二维表格,方便绘制柱状图。最后,我们设置了图表的标题和坐标轴标签,并使用plt.show()函数显示图表。
2. 箱线图
``` python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv('survey lung cancer.csv')
# 绘制箱线图
fig, ax = plt.subplots(figsize=(10, 6))
data.boxplot(column='Age', by='Smokes', ax=ax)
# 设置图表标题和坐标轴标签
plt.title('Lung Cancer Survey')
plt.xlabel('Smoking Status')
plt.ylabel('Age')
# 显示图表
plt.show()
```
在这个示例中,我们使用了数据集中的Age和Smokes列来绘制箱线图。其中,boxplot函数用于绘制箱线图,第一个参数为要绘制的列,第二个参数为按照哪一列进行分组。最后,我们设置了图表的标题和坐标轴标签,并使用plt.show()函数显示图表。
希望这两个示例可以帮助您绘制年龄/抽烟情况的可视化。如果您有任何其他问题,请随时问我。
阅读全文