泰坦尼克号数据可视化:总体生还几率饼状图代码
时间: 2024-11-20 17:27:50 浏览: 4
泰坦尼克号数据集是一个经典的数据分析项目,其中包含乘客的信息以及他们在泰坦尼克号沉船事件中的生死情况。为了展示总体生还几率,你可以使用Python的数据科学库如pandas和matplotlib创建饼状图。以下是一个简单的例子:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据
titanic_data = pd.read_csv('titanic.csv') # 假设数据位于CSV文件中
# 提取需要的列,比如'Survived'(生存状态)和'Pclass'(乘客等级)
survival_counts = titanic_data.groupby(['Survived', 'Pclass']).size().unstack(fill_value=0)
# 计算总人数
total_passengers = survival_counts.sum().sum()
# 绘制饼状图
plt.figure(figsize=(8,6))
survival_counts.plot(kind='pie', autopct='%1.1f%%', labels=['死亡', '幸存'], startangle=90)
plt.title('泰坦尼克号乘客生还率')
plt.legend(title='乘客等级', loc='upper center')
plt.ylabel('')
plt.tight_layout()
plt.show()
相关问题
python代码实现泰坦尼克号数据可视化
以下是一个简单的Python代码示例,用于可视化泰坦尼克号数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据集
titanic = pd.read_csv('titanic.csv')
# 绘制存活人数的条形图
survived_count = titanic['Survived'].value_counts()
survived_count.plot(kind='bar')
plt.title('Survived or Not')
plt.xlabel('Survival Status')
plt.ylabel('Number of Passengers')
plt.xticks([0,1], ['Not Survived', 'Survived'])
plt.show()
# 绘制乘客性别比例的饼图
gender_count = titanic['Sex'].value_counts()
gender_count.plot(kind='pie', autopct='%1.1f%%')
plt.title('Gender Proportion')
plt.legend(['Female', 'Male'])
plt.show()
# 绘制不同舱位乘客的存活率的柱状图
pclass_survived = titanic.groupby(['Pclass', 'Survived']).size().unstack()
pclass_survived.plot(kind='bar', stacked=True)
plt.title('Survival Rate by Pclass')
plt.xlabel('Pclass')
plt.ylabel('Number of Passengers')
plt.xticks(rotation=0)
plt.legend(['Not Survived', 'Survived'])
plt.show()
```
这段代码使用Pandas和Matplotlib库加载泰坦尼克号数据集,并绘制了三个不同的图表:一个条形图显示存活人数,一个饼图显示乘客性别比例,以及一个柱状图显示不同舱位乘客的存活率。这些图表可以帮助我们更好地理解泰坦尼克号数据集中的信息。
泰坦尼克号数据可视化 pychart
泰坦尼克号数据可视化是一个常见的数据分析项目,通常用于探索历史灾难中的乘客信息,如性别、年龄、等级等,以及它们与生存率之间的关系。PyChart,虽然不是直接用于泰坦尼克数据可视化的库,但如果要用Python进行图表展示,可以考虑使用matplotlib、seaborn或plotly等流行的可视化工具。
例如,你可以这样做:
1. 导入所需库:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
```
2. 加载泰坦尼克号数据:
```python
titanic_data = pd.read_csv("titanic.csv") # 假设数据存储在一个CSV文件中
```
3. 数据清洗和预处理:
```python
# 删除缺失值或处理分类变量
titanic_data.dropna(subset=['Survived'], inplace=True)
```
4. 绘制生存率的柱状图或饼图:
```python
sns.countplot(x='Survived', data=titanic_data)
plt.xlabel('生存状态')
plt.ylabel('人数')
plt.title('泰坦尼克号乘客生存情况')
plt.show()
```
5. 可视化更复杂的关系,比如年龄和存活率的分布,可以使用散点图或箱线图:
```python
sns.boxenplot(x='Age', y='Survived', data=titanic_data)
plt.xlabel('年龄')
plt.ylabel('生存')
plt.title('年龄对生存的影响')
plt.show()
```
阅读全文