首页Python怎样根据词表统计词频并把结果输出到文件

Python怎样根据词表统计词频并把结果输出到文件

时间: 2024-02-12 14:03:12 浏览: 132

基于 python 实现英文文章的词频统计，并画出词频图

【作品名称】：基于 python 实现英文文章的词频统计，并画出词频图【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。【项目介绍】：英文文章的词频统计，并画出词频图。关于停用词表，to、the、a等词的频率过高，需要将这些常用的冠词也加入到停用词表内。

要根据词表统计词频并将结果输出到文件中，可以使用Python中的collections库和pandas库。下面是一个示例代码，可以帮助你完成这个任务： ```python import collections import pandas as pd # 读取要统计的文本文件 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 读取词表文件 with open('vocab.txt', 'r', encoding='utf-8') as f: vocab = [line.strip() for line in f.readlines()] # 统计词频 word_count = collections.Counter(text.split()) # 用pandas库将结果输出到文件 df = pd.DataFrame({'word': vocab, 'count': [word_count[word] for word in vocab]}) df.to_csv('result.csv', index=False) ``` 这个示例代码首先从文件中读取要统计的文本和词表文件，然后使用collections库中的Counter类统计词频。接下来，使用pandas库将结果输出到CSV文件中。你可以根据自己的需求修改示例代码中的文件名和路径，并且可以使用不同的文件格式来输出结果。

阅读全文