pyecharts根据提供的数据“employee.csv”,分析各产业就业人员数据特征间的关系,要求选择合适的图表进行可视化,展示2000年——2019年各产业就业人员数据分布情况、各产业就业人员变化趋势
时间: 2024-10-21 21:18:28 浏览: 43
员工离职数据employee.csv
5星 · 资源好评率100%
Pyecharts是一个强大的Python数据分析和可视化库,它可以很好地帮助你处理"employee.csv"文件的数据并创建各种图表来展现各产业就业人员数据的特征关系。首先,你需要加载数据,并对时间序列(如年份)进行处理。
1. 导入库和数据:
```python
import pandas as pd
import pyecharts.options as opts
from pyecharts.charts import Line, Bar
df = pd.read_csv('employee.csv')
year_data = df.groupby(['Industry', 'Year'])['Employment'].sum().reset_index()
```
2. 对比各产业就业人员分布情况(Bar Chart):
```python
bar_chart = (
Bar()
.add_xaxis(year_data['Year'])
.add_yaxis('Industry Employment', year_data['Employment'], category_gap='60%', is_stack=True)
.set_global_opts(title_opts=opts.TitleOpts(title='各产业就业人员分布'))
.render('employment_distribution.html')
)
```
这将生成一个堆叠柱状图,显示每个行业的就业人数随着时间的变化。
3. 显示各产业就业人员变化趋势(Line Chart):
```python
line_chart = (
Line()
.add_xaxis(year_data['Year'])
.add_yaxis('Industry Trend', year_data.groupby('Industry')['Employment'].mean(), markpoint_opts=opts.MarkPointOpts(data=[opts.MarkPointItem(name='average', coord=(x, y)) for x, y in zip(year_data['Year'], year_data.groupby('Industry')['Employment'].mean())]))
.set_series_opts(label_opts=opts.LabelOpts(position="top"))
.set_global_opts(title_opts=opts.TitleOpts(title='各产业就业人员变化趋势'))
.render('employment_trend.html')
)
```
这里会生成一条折线图,用于展示各行业就业人数的平均值随时间的趋势。
阅读全文