kind = df['类型'].str.split(" ").str[0].value_counts().nlargest(13) # 统计每个电影类型的数量 types_dict = {} for types in df['类型']: for t in types.split(' '): if t.strip() != '': types_dict[t.strip()] = types_dict.get(t.strip(), 0) + 1 # 将数据转化为pyecharts需要的格式 kind = [] for k, v in types_dict.items(): kind.append({ 'value': v, 'name': k }) # 画图 treemap = ( TreeMap() .add('豆瓣TOP250-电影类型图', kind) .set_global_opts( title_opts=opts.TitleOpts(title='豆瓣top250电影类型的树状矩形图'), legend_opts=opts.LegendOpts(is_show=False) ) .set_series_opts( label_opts=opts.LabelOpts(position='inside') ) ) treemap.render_notebook() 修改代码使其能将数字显示出来
时间: 2023-06-26 17:04:46 浏览: 163
数据分析之电影类型数量分析
可以在 `label_opts` 中添加 `formatter` 参数,使其能将数字显示出来。修改后的代码如下:
```python
import pandas as pd
from pyecharts.charts import TreeMap
from pyecharts import options as opts
df = pd.read_csv('douban_top250.csv', encoding='utf-8')
types_dict = {}
for types in df['类型']:
for t in types.split(' '):
if t.strip() != '':
types_dict[t.strip()] = types_dict.get(t.strip(), 0) + 1
kind = []
for k, v in types_dict.items():
kind.append({
'value': v,
'name': k
})
treemap = (
TreeMap()
.add('豆瓣TOP250-电影类型图', kind)
.set_global_opts(
title_opts=opts.TitleOpts(title='豆瓣top250电影类型的树状矩形图'),
legend_opts=opts.LegendOpts(is_show=False)
)
.set_series_opts(
label_opts=opts.LabelOpts(position='inside', formatter="{b}: {c}")
)
)
treemap.render_notebook()
```
在 `label_opts` 中添加了 `formatter="{b}: {c}"`,其中 `{b}` 表示名称,`{c}` 表示数值,冒号后面的空格是为了美观。这样就能将数字显示出来了。
阅读全文