Python 对csv文件统计上榜IMDB的次数最多的导演的前5位、前10位储存在Excel表格中
时间: 2024-03-25 16:38:38 浏览: 56
好的,我可以帮您实现这个需求。您可以参考以下的Python代码:
```python
import csv
from collections import Counter
import pandas as pd
# 读取CSV文件
with open('IMDB.csv', encoding='utf-8') as f:
reader = csv.reader(f)
# 跳过标题行
next(reader)
# 统计导演出现的次数
director_count = Counter(row[1] for row in reader if row[1])
# 取前5位和前10位的导演
top5_directors = director_count.most_common(5)
top10_directors = director_count.most_common(10)
# 将结果存储到Excel表格中
df1 = pd.DataFrame(top5_directors, columns=['Director', 'Count'])
df2 = pd.DataFrame(top10_directors, columns=['Director', 'Count'])
writer = pd.ExcelWriter('IMDB_directors.xlsx')
df1.to_excel(writer, sheet_name='Top 5 Directors', index=False)
df2.to_excel(writer, sheet_name='Top 10 Directors', index=False)
writer.save()
```
在上面的代码中,我们首先使用`csv.reader`读取CSV文件,并使用`collections.Counter`统计导演出现的次数。然后,我们使用`most_common`方法取出出现次数最多的前5位和前10位导演。最后,我们使用`pandas`库将结果存储到Excel表格中。需要注意的是,代码中的`'IMDB.csv'`是指您的CSV文件路径,请根据实际情况进行修改。
阅读全文