如何对路径为"D:\python-learning\新建文件夹\患者评价京东健康.xlsx"的excel第一列的文本用python进行分词然后统计词频
时间: 2024-12-29 15:32:58 浏览: 21
在Python中,我们可以使用pandas库来处理Excel文件,jieba库来进行中文分词,以及collections库来统计词频。以下是步骤:
首先,你需要安装所需的库,如果还没安装,可以使用以下命令安装:
```bash
pip install pandas jieba collections
```
然后,你可以按照以下代码进行操作:
```python
import pandas as pd
import jieba
from collections import Counter
# 读取Excel文件
file_path = "D:/python-learning/新建文件夹/患者评价京东健康.xlsx"
df = pd.read_excel(file_path)
# 获取第一列数据(假设它是评论文本)
column_name = df.columns[0] # 假设列名是'评价'
comments = df[column_name]
# 对文本进行分词
words_list = []
for comment in comments:
words = jieba.lcut(comment) # 使用jieba分词
words_list.extend(words)
# 统计词频
word_freq = Counter(words_list)
# 打印最常见的n个词及其频率
n = 10 # 自定义显示前n个高频词
most_common_words = word_freq.most_common(n)
print(f"最常见的{n}个词及频率:")
for word, freq in most_common_words:
print(f"{word}: {freq}")
```
在这个例子中,我们假定第一列是评论文本,并且列名为'评价'。如果你的实际情况不同,需要相应调整列名获取。
阅读全文
相关推荐


















