给定一个csv数据集,其中某个属性为电影类型,比如某条数据的电影类型为“剧情/爱情”,利用python,写一个方法,实现对剧情的统计以及类型总数的统计
时间: 2023-06-25 15:05:48 浏览: 66
可以使用pandas和numpy库来处理csv数据,并使用字符串函数来处理电影类型属性。以下是一个示例代码:
```python
import pandas as pd
import numpy as np
def count_movie_genres(csv_file):
# 读取csv文件
df = pd.read_csv(csv_file)
# 将电影类型属性转为字符串类型
df['电影类型'] = df['电影类型'].astype(str)
# 统计剧情类型的电影数量
drama_count = df[df['电影类型'].str.contains('剧情')].shape[0]
# 统计所有电影类型的数量
genres = df['电影类型'].str.split('/').apply(pd.Series).stack().unique()
genres_count = len(genres)
# 返回结果
return {'剧情电影数量': drama_count,
'电影类型总数': genres_count}
```
在这个方法中,我们首先使用pandas库的`read_csv()`方法读取csv文件,并将电影类型属性转为字符串类型。然后,我们使用字符串函数`contains()`来筛选剧情类型的电影,并使用pandas库的`shape`属性来计算剧情类型电影的数量。接着,我们使用字符串函数`split()`和`apply()`来拆分电影类型属性并计算所有电影类型的数量,最后返回一个包含剧情电影数量和电影类型总数的字典。
阅读全文