pandas绘制一个年龄和船票价格散点图
时间: 2024-09-29 12:12:15 浏览: 63
在Python的数据分析库pandas中,你可以使用matplotlib或其他可视化库如seaborn来创建散点图,展示年龄(Age)和船票价格(Ticket Price)。下面是一个简单的步骤:
首先,你需要有包含这两个变量的pandas DataFrame。假设`df`是你存储数据的DataFrame,其中`Age`列是年龄,`Fare`列是票价。
```python
import matplotlib.pyplot as plt
# 假设df是你已经加载好的数据
plt.figure(figsize=(10, 6)) # 设置图表大小
# 绘制散点图
scatter = df.plot(kind='scatter', x='Age', y='Fare')
# 可能需要添加标题和标签
scatter.set_title('Age vs Ticket Price Scatter Plot')
scatter.set_xlabel('Age')
scatter.set_ylabel('Ticket Fare')
# 显示图形
plt.show()
```
这个例子中,`plot(kind='scatter')`函数用于创建散点图,x轴表示年龄,y轴表示票价。如果你想更详细地探索数据分布,可以考虑分组或者颜色编码等高级特性。
相关问题
python 绘制乘客年龄和船票价格的散点图
在Python中,你可以使用matplotlib库来绘制散点图,展示乘客年龄和船票价格之间的关系。假设你有一个包含乘客数据的DataFrame,其中包含'Age'列表示年龄,'Fare'列表示票价。以下是简单的步骤:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 假设df是你的DataFrame
if 'Age' in df.columns and 'Fare' in df.columns:
# 提取年龄和票价数据
ages = df['Age'].values
fares = df['Fare'].values
# 创建散点图
plt.scatter(ages, fares)
# 设置图表标题和轴标签
plt.title('乘客年龄与船票价格的关系')
plt.xlabel('年龄')
plt.ylabel('船票价格')
# 显示图形
plt.show()
```
如果你的数据不在DataFrame里,需要先按照这个结构准备数据。记得检查列名是否正确,以及数据是否存在。
matplotlib探索泰坦尼克灾难数据 (1) 将数据框命名为titanic (2) 将PassengerId设置为索引 (3) 绘制一个展示男女乘客比例的扇形图 (4) 绘制一个展示船票Fare, 与乘客年龄和性别的散点图 (5) 有多少人生还? (6) 绘制一个展示船票价格的直方图
好的,以下是使用Python对Titanic数据进行探索的代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取Titanic数据集
titanic = pd.read_csv('titanic.csv')
# 将PassengerId设置为索引
titanic.set_index('PassengerId', inplace=True)
# 绘制一个展示男女乘客比例的扇形图
sex_counts = titanic['Sex'].value_counts()
plt.pie(sex_counts, labels=sex_counts.index, autopct='%1.1f%%', startangle=90)
plt.title('Sex Ratio of Titanic Passengers')
plt.show()
# 绘制一个展示船票Fare, 与乘客年龄和性别的散点图
plt.scatter(titanic['Age'], titanic['Fare'], c=titanic['Sex'].map({'male': 'b', 'female': 'r'}), alpha=0.5)
plt.xlabel('Age')
plt.ylabel('Fare')
plt.title('Fare vs Age by Sex')
plt.show()
# 计算生还人数
survived_counts = titanic['Survived'].value_counts()
num_survived = survived_counts[1]
# 输出生还人数
print('There were {} survivors on the Titanic.'.format(num_survived))
# 绘制一个展示船票价格的直方图
plt.hist(titanic['Fare'], bins=20)
plt.xlabel('Fare')
plt.ylabel('Count')
plt.title('Distribution of Titanic Fares')
plt.show()
```
运行以上代码,即可完成对Titanic数据的探索。其中,代码实现了以下功能:
1. 读取Titanic数据集并将其命名为titanic。
2. 将PassengerId设置为索引。
3. 绘制了一个展示男女乘客比例的扇形图。
4. 绘制了一个展示船票Fare, 与乘客年龄和性别的散点图。
5. 计算了生还人数并输出结果。
6. 绘制了一个展示船票价格的直方图。
您可以根据需要修改代码,以符合您的分析需求。
阅读全文