KeyError: "Column(s) ['title'] do not exist"根据这个错误完善import pandas as pd import matplotlib.pyplot as plt df = pd.read_excel('C:\Users\zwj\Desktop\豆瓣读书排行榜-清洗后.xlsx') author_count = df.groupby('作者').agg({'title': 'count'}).reset_index() author_count.columns = ['作者', 'book_count'] top_authors = author_count.sort_values('book_count', ascending=False).head(5) plt.bar(top_authors['作者'], top_authors['book_count']) plt.xlabel('作者') plt.ylabel('作品数量') plt.title('图数量前五作者') plt.show()
时间: 2023-06-18 20:05:22 浏览: 170
apache error.log 找恶意IP并禁止
这个错误通常是因为读取的 Excel 文件中没有名为 "title" 的列。请确保 Excel 文件中存在名为 "title" 的列,并且文件路径中的反斜杠已经转义。
你可以尝试使用双反斜杠或者单斜杠来表示文件路径,例如:
```
df = pd.read_excel('C:\\Users\\zwj\\Desktop\\豆瓣读书排行榜-清洗后.xlsx')
```
或者
```
df = pd.read_excel('C:/Users/zwj/Desktop/豆瓣读书排行榜-清洗后.xlsx')
```
如果你确定文件中存在名为 "title" 的列,那么你可以检查一下列名拼写是否正确。
阅读全文