pyecharts画出豆瓣top250电影,中外电影上映年份分布折线图
时间: 2023-06-26 19:04:25 浏览: 132
首先需要安装pyecharts库,可以通过以下命令进行安装:
```
pip install pyecharts
```
接下来是绘制折线图的代码:
```python
from pyecharts.charts import Line
from pyecharts import options as opts
import pandas as pd
# 读取数据
df = pd.read_csv('douban_top250_movies.csv', encoding='utf-8')
# 数据清洗
df['year'] = df['year'].apply(lambda x: x.strip('()'))
df['year'] = df['year'].apply(lambda x: x.split('/')[0])
df['year'] = df['year'].astype(int)
# 按照年份统计中外电影数量
foreign = df[df['country'].str.contains('中国') == False]['year'].value_counts().sort_index()
china = df[df['country'].str.contains('中国') == True]['year'].value_counts().sort_index()
# 绘制折线图
line = (
Line()
.add_xaxis(list(foreign.index))
.add_yaxis("外国电影", list(foreign.values), is_smooth=True)
.add_yaxis("中国电影", list(china.values), is_smooth=True)
.set_global_opts(title_opts=opts.TitleOpts(title="豆瓣Top250电影中外电影上映年份分布折线图"),
xaxis_opts=opts.AxisOpts(name="年份"),
yaxis_opts=opts.AxisOpts(name="电影数量"),
tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"))
.render("douban_top250_movies_year.html")
)
```
在运行完上述代码后,会在当前目录下生成一个名为“douban_top250_movies_year.html”的文件,打开该文件即可查看折线图。
阅读全文