1.2 数据简要分析:统计一下各上映时间段电影数量和平均得分:1960 年代 之前,1960-1969,1970-1979,1980-1989,1990-1999,2000-2009,2010-2020, 2020 至今的 8 个区间; 思考:使用 pandas 中的 cut 方法将年份划分为若干区间,然后将联合使用 groupby(film_time)[列索引电影数量].count()和 groupby(列索引年份)[列索引电影 评分].mean()方法
时间: 2023-02-10 18:26:08 浏览: 219
可以使用 pandas 的 cut 方法将年份划分为若干区间,然后使用 groupby 方法统计各个时间段的电影数量和平均得分。
假设你有一个包含电影上映年份和评分的 DataFrame,其中列 "year" 记录了电影上映年份,列 "rating" 记录了电影评分。
你可以使用如下代码将年份划分为 8 个区间:
```
bins = [1959, 1969, 1979, 1989, 1999, 2009, 2020, 2023]
film_time = pd.cut(df["year"], bins)
```
然后使用 groupby 方法统计各个时间段的电影数量:
```
df.groupby(film_time)["year"].count()
```
计算各个时间段的电影平均得分:
```
df.groupby(film_time)["rating"].mean()
```
这样就可以获得各个时间段的电影数量和平均得分的统计信息了。
阅读全文