分析船票号Ticket和获救Survived之间的关系Python代码
时间: 2024-10-13 16:03:18 浏览: 34
利用Python+matplotlib对泰坦尼克号进行数据分析
在Python中分析船票号(Ticket)和获救(Survived)之间的关系通常涉及数据可视化和统计分析。如果你有一个包含乘客信息的数据集,比如Pandas DataFrame,你可以使用如下的代码来探索两者的关系:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 假设df是一个DataFrame,其中包含'Ticket'和'Survived'列
df = pd.read_csv('titanic_data.csv') # 替换为实际数据文件路径
# 检查Ticket和Survived的数据类型
print(df['Ticket'].head())
print(df['Survived'].value_counts())
# 删除包含空值的行
df = df.dropna(subset=['Ticket', 'Survived'])
# 将Ticket转换成数值类型或其他形式便于分析,如果原始Ticket是分类编码
df['Ticket'] = df['Ticket'].astype('category').cat.codes
# 绘制Survived与Ticket的直方图或箱线图
sns.countplot(x='Ticket', hue='Survived', data=df)
plt.xlabel('Ticket Number')
plt.ylabel('Number of Passengers')
plt.title('Survival Rate by Ticket Type')
# 或者计算Survived和Ticket类型的描述性统计和关联度
correlation = df[['Ticket', 'Survived']].corr().iloc[0, 1]
print(f"Coefficient of correlation between Ticket and Survived: {correlation:.2f}")
阅读全文