Python分析经济普查数据
时间: 2023-12-29 14:02:07 浏览: 34
以下是使用Python分析经济普查数据的步骤:
1. 导入需要的模块和数据文件
```python
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('/Users/书店图书/数据分析与可视化/普查数据.csv', encoding='gbk')
```
2. 查看数据的基本信息
```python
# 查看数据的前5行
print(data.head())
# 查看数据的基本信息
print(data.info())
# 查看数据的统计信息
print(data.describe())
```
3. 数据清洗和预处理
```python
# 删除缺失值
data.dropna(inplace=True)
# 将字符串类型的数值转换为浮点型
data['人均收入'] = data['人均收入'].astype(float)
# 将数据按照人均收入从高到低排序
data.sort_values(by='人均收入', ascending=False, inplace=True)
```
4. 数据分析和可视化
```python
# 统计各个省份的人均收入,并绘制柱状图
income_by_province = data.groupby('省份')['人均收入'].mean()
income_by_province.plot(kind='bar')
plt.title('各省份人均收入')
plt.xlabel('省份')
plt.ylabel('人均收入')
plt.show()
# 统计各个城市的人均收入,并绘制箱线图
income_by_city = data.groupby('城市')['人均收入'].mean()
income_by_city.plot(kind='box')
plt.title('各城市人均收入')
plt.ylabel('人均收入')
plt.show()
# 统计各个年龄段的人均收入,并绘制折线图
income_by_age = data.groupby('年龄')['人均收入'].mean()
income_by_age.plot(kind='line')
plt.title('各年龄段人均收入')
plt.xlabel('年龄')
plt.ylabel('人均收入')
plt.show()
```