python文本分析(2)——统计英文文件中的单词数
时间: 2023-11-16 14:05:46 浏览: 212
python统计文本文件内单词数量的方法
以下是一个简单的 Python 程序,可以用于统计英文文本文件中的单词数。该程序基于正则表达式,使用了 Python 的 re 模块。
```python
import re
def count_words(file_path):
with open(file_path, 'r') as f:
text = f.read()
words = re.findall(r'\b\w+\b', text)
return len(words)
file_path = 'example.txt'
num_words = count_words(file_path)
print(f'The file "{file_path}" contains {num_words} words.')
```
程序接受一个文件路径作为输入,打开文件并读取其中的文本内容。接着,使用正则表达式 `\b\w+\b` 查找所有的单词,并将它们存储在一个列表中。最后,返回单词列表的长度,即为文件中的单词数。
需要注意的是,该程序假设单词之间以空格或其他非字符(如标点符号)分隔。如果文件中包含其他类型的分隔符,如制表符或换行符,可能需要对正则表达式进行适当的修改。
阅读全文