首页如何对路径为"D:\python-learning\新建文件夹\患者评价京东健康.xlsx"的excel第一列的文本用python进行分词然后统计词频

如何对路径为"D:\python-learning\新建文件夹\患者评价京东健康.xlsx"的excel第一列的文本用python进行分词然后统计词频

时间: 2024-12-29 15:32:58 浏览: 21

在Python中，我们可以使用pandas库来处理Excel文件，jieba库来进行中文分词，以及collections库来统计词频。以下是步骤：首先，你需要安装所需的库，如果还没安装，可以使用以下命令安装： ```bash pip install pandas jieba collections ``` 然后，你可以按照以下代码进行操作： ```python import pandas as pd import jieba from collections import Counter # 读取Excel文件 file_path = "D:/python-learning/新建文件夹/患者评价京东健康.xlsx" df = pd.read_excel(file_path) # 获取第一列数据（假设它是评论文本） column_name = df.columns[0] # 假设列名是'评价' comments = df[column_name] # 对文本进行分词 words_list = [] for comment in comments: words = jieba.lcut(comment) # 使用jieba分词 words_list.extend(words) # 统计词频 word_freq = Counter(words_list) # 打印最常见的n个词及其频率 n = 10 # 自定义显示前n个高频词 most_common_words = word_freq.most_common(n) print(f"最常见的{n}个词及频率：") for word, freq in most_common_words: print(f"{word}: {freq}") ``` 在这个例子中，我们假定第一列是评论文本，并且列名为'评价'。如果你的实际情况不同，需要相应调整列名获取。

阅读全文