用python语言写一段pandas代码,分析2021年全国离婚率和结婚率
时间: 2024-05-08 15:14:49 浏览: 95
假设我们已经下载了2021年全国各省市离婚率和结婚率的数据集,文件名为"marriage_divorce_2021.csv",数据格式如下:
| 省市 | 结婚率 | 离婚率 |
| --- | --- | --- |
| 北京市 | 8.10 | 2.30 |
| 天津市 | 8.20 | 2.50 |
| 河北省 | 8.60 | 2.80 |
| ... | ... | ... |
我们可以使用pandas库进行数据分析和可视化,代码如下:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据集
df = pd.read_csv("marriage_divorce_2021.csv", encoding="utf-8")
# 计算全国平均结婚率和离婚率
avg_marriage_rate = df["结婚率"].mean()
avg_divorce_rate = df["离婚率"].mean()
# 输出全国平均结婚率和离婚率
print("全国平均结婚率:", avg_marriage_rate)
print("全国平均离婚率:", avg_divorce_rate)
# 绘制结婚率和离婚率的箱线图
df[["结婚率", "离婚率"]].plot(kind="box", vert=False, figsize=(8, 4))
plt.title("2021年全国结婚率和离婚率分布箱线图")
plt.show()
# 绘制结婚率和离婚率的散点图
df.plot(kind="scatter", x="结婚率", y="离婚率", figsize=(8, 6))
plt.title("2021年全国结婚率和离婚率散点图")
plt.xlabel("结婚率")
plt.ylabel("离婚率")
plt.show()
```
运行以上代码,我们可以得到全国平均结婚率和离婚率,并绘制出结婚率和离婚率的箱线图和散点图,以便更好地了解数据分布和趋势。
阅读全文