用pyecharts画一个豆瓣top250电影类型的树状矩形图
时间: 2023-06-24 22:06:55 浏览: 92
豆瓣电影top250.py
好的,以下是用pyecharts画豆瓣top250电影类型的树状矩形图的代码:
```python
from pyecharts import options as opts
from pyecharts.charts import TreeMap
import pandas as pd
# 读取数据
df = pd.read_csv('douban_top250.csv')
# 统计不同类型电影出现的次数
types_dict = {}
for types in df['类型']:
for t in types.split('/'):
if t.strip() != '':
types_dict[t.strip()] = types_dict.get(t.strip(), 0) + 1
# 将数据转化为pyecharts需要的格式
data = []
for k, v in types_dict.items():
data.append({
'value': v,
'name': k
})
# 画图
treemap = TreeMap()
treemap.add('豆瓣top250电影类型', data)
treemap.set_global_opts(
title_opts=opts.TitleOpts(title='豆瓣top250电影类型的树状矩形图'),
legend_opts=opts.LegendOpts(is_show=False)
)
treemap.set_series_opts(
label_opts=opts.LabelOpts(position='inside')
)
treemap.render_notebook()
```
需要注意的是,上述代码需要依赖pandas和pyecharts两个库,如果没有安装可以使用以下命令进行安装:
```bash
pip install pandas pyecharts
```
同时需要有一份豆瓣电影top250的数据,可以从网上下载或者自己爬取。数据格式如下:
| 名称 | 导演 | 类型 | 国家地区 | 语言 | 上映日期 | 片长 | 评分 | 评价人数 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 肖申克的救赎 | 弗兰克·德拉邦特 | 剧情/犯罪 | 美国 | 英语 | 1994-09-10 | 142分钟 | 9.7 | 2225389 |
| .... | .... | .... | .... | .... | .... | .... | .... | .... |
如果数据存储在douban_top250.csv文件中,可以使用`pd.read_csv('douban_top250.csv')`读取数据。
阅读全文