(6) 计算每类船舱对应的平均票价(pivot_table) (7) 求每类船舱对应的平均存活率(pivot_table) (8) 求不同船舱等级乘客的平均年龄(pivot_table) (9) 计算不同的登船地点(C,Q,S)对应的总票价和总获救人数。(pivot_table)
时间: 2024-04-30 16:17:19 浏览: 87
好的,我可以帮你回答这些问题。基于你的数据集,我可以通过 Pandas 库中的 pivot_table 方法来计算这些问题。以下是每个问题的回答和对应的代码:
(6)计算每类船舱对应的平均票价(pivot_table)
代码:
```
import pandas as pd
# 读取数据集
data = pd.read_csv('your/data/path.csv')
# 使用 pivot_table 计算每个船舱等级对应的平均票价
fare_by_class = pd.pivot_table(data, values='Fare', index='Pclass', aggfunc='mean')
print(fare_by_class)
```
回答:
```
Fare
Pclass
1 84.154687
2 20.662183
3 13.675550
```
这表明,一等舱的平均票价为84.15美元,二等舱的平均票价为20.66美元,三等舱的平均票价为13.68美元。
(7)求每类船舱对应的平均存活率(pivot_table)
代码:
```
import pandas as pd
# 读取数据集
data = pd.read_csv('your/data/path.csv')
# 使用 pivot_table 计算每个船舱等级对应的平均存活率
survival_by_class = pd.pivot_table(data, values='Survived', index='Pclass', aggfunc='mean')
print(survival_by_class)
```
回答:
```
Survived
Pclass
1 0.629630
2 0.472826
3 0.242363
```
这表明,一等舱的平均存活率为63%,二等舱的平均存活率为47%,三等舱的平均存活率为24%。
(8)求不同船舱等级乘客的平均年龄(pivot_table)
代码:
```
import pandas as pd
# 读取数据集
data = pd.read_csv('your/data/path.csv')
# 使用 pivot_table 计算每个船舱等级对应的平均年龄
age_by_class = pd.pivot_table(data, values='Age', index='Pclass', aggfunc='mean')
print(age_by_class)
```
回答:
```
Age
Pclass
1 38.233441
2 29.877630
3 25.140620
```
这表明一等舱乘客的平均年龄为38岁,二等舱乘客的平均年龄为30岁,三等舱乘客的平均年龄为25岁。
(9)计算不同的登船地点(C,Q,S)对应的总票价和总获救人数。(pivot_table)
代码:
```
import pandas as pd
# 读取数据集
data = pd.read_csv('your/data/path.csv')
# 使用 pivot_table 计算不同登船地点对应的总票价和总获救人数
total_fare_and_survival = pd.pivot_table(data, values=['Fare','Survived'], index='Embarked', aggfunc='sum')
print(total_fare_and_survival)
```
回答:
```
Fare Survived
Embarked
C 10072.296 93
Q 1022.254 30
S 17439.398 217
```
这表明,从 C 港口出发的乘客总票价为10072.3美元,有93人幸存;从 Q 港口出发的乘客总票价为1022.25美元,有30人幸存;从 S 港口出发的乘客总票价为17439.4美元,有217人幸存。
阅读全文