帮我写一个在jupyternotebook,中读取excel文件画词频图的代码。excel文件中提供两列,第一列是词语,第二列是词语一共出现的次数。
时间: 2024-10-11 21:04:16 浏览: 36
summarization
在Jupyter Notebook中,你可以使用pandas库来读取Excel文件,并结合matplotlib或seaborn库来创建词频图。下面是一个简单的例子:
```python
# 首先,确保已经安装了所需的库
import pandas as pd
import matplotlib.pyplot as plt
# 使用pandas读取Excel文件
# 假设文件名为'data.xlsx',并且第一列是'text',第二列是'count'
df = pd.read_excel('data.xlsx', usecols=['text', 'count'])
# 检查数据是否读取成功
print(df.head())
# 将'text'列转换为列表以便进一步处理
words = df['text'].tolist()
# 统计词频
word_counts = {word: count for word, count in zip(words, df['count'])}
# 将字典转换为DataFrame,方便绘图
df_word_counts = pd.DataFrame.from_dict(word_counts, orient='index', columns=['Count'])
# 创建词频图
plt.figure(figsize=(10, 6))
df_word_counts['Count'].plot(kind='bar')
plt.title('Word Frequency')
plt.xlabel('Words')
plt.ylabel('Frequency')
plt.show()
```
这个代码会生成一个条形图,显示每个词及其出现的次数。如果你需要更详细的美化或者其他类型的图形,可以调整matplotlib的参数。
阅读全文