编写函数,参数是一个文件的文件名,统一一个文件中单词出现的次数,用jupyter写
时间: 2024-09-06 10:05:04 浏览: 34
Python读取英文文件并记录每个单词出现次数后降序输出示例
5星 · 资源好评率100%
编写一个函数来统计一个文件中单词出现的次数,你可以使用Python中的标准库函数来实现。以下是一个简单的例子,使用了`collections`模块中的`Counter`类来帮助我们计数。请注意,为了在Jupyter Notebook中运行此代码,你需要确保文件已经存在于你的工作目录中,并且文件路径正确。
```python
import collections
import re
def count_words_in_file(filename):
with open(filename, 'r', encoding='utf-8') as file:
# 使用正则表达式提取单词
words = re.findall(r'\w+', file.read().lower())
# 使用Counter统计单词出现的次数
word_counts = collections.Counter(words)
return word_counts
# 使用示例
file_name = 'example.txt' # 确保这个文件在你的工作目录中
word_count = count_words_in_file(file_name)
print(word_count)
```
在这个函数中,`open`函数用于打开并读取文件,`re.findall`用于匹配文件中的所有单词(这里定义单词为由字母或数字组成的序列),`lower()`方法用于将所有文本转换为小写,以便统计时不区分大小写,而`collections.Counter`用于生成单词及其出现次数的计数器。
阅读全文