基于spyder软件对数据进行统计分析可视化的代码
时间: 2024-05-17 18:17:19 浏览: 123
以下是使用Python中的pandas、matplotlib和seaborn库进行数据统计分析和可视化的示例代码。在Spyder软件中运行以下代码需要先安装这些库。
```python
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 读取数据文件
df = pd.read_csv('data.csv')
# 查看数据前5行
print(df.head())
# 查看数据基本统计信息
print(df.describe())
# 统计每个城市的人口数量
populations = df.groupby('City')['Population'].sum()
# 绘制城市人口数量条形图
populations.plot(kind='bar', color='r')
plt.xlabel('City')
plt.ylabel('Population')
plt.title('Population by City')
plt.show()
# 统计每个城市的平均房价
prices = df.groupby('City')['Price'].mean()
# 绘制城市平均房价箱线图
sns.boxplot(x='City', y='Price', data=df)
plt.xlabel('City')
plt.ylabel('Price')
plt.title('Price by City')
plt.show()
```
上述代码假设数据文件名为data.csv,包含三列数据:City(城市名称)、Population(城市人口数量)和Price(平均房价)。代码首先使用pandas库读取数据文件,并输出数据的前5行和基本统计信息。然后,使用groupby方法统计每个城市的人口数量和平均房价,并使用matplotlib和seaborn库绘制条形图和箱线图分别展示这些统计数据。
阅读全文