已知文件,统计文件中某行单词有多少种,,不算标点符号,单词是英文单词,写一段python代码
时间: 2024-03-08 16:50:16 浏览: 125
基于Python实现的一个命令行文本计数统计程序,可统计纯英文txt文本中的字符数,单词数,句子数,Python文件行数
可以使用Python中的正则表达式和集合(set)来实现这个功能。具体代码如下:
```python
import re
def count_words(line):
# 使用正则表达式匹配所有的单词
words = re.findall(r'\b\w+\b', line)
# 使用集合去重,统计单词种类数
return len(set(words))
# 读取文件内容
with open('file.txt', 'r') as f:
content = f.readlines()
# 统计每行单词种类数
for line in content:
count = count_words(line)
print(f'Line "{line.strip()}" has {count} different words.')
```
其中,`count_words`函数使用正则表达式`\b\w+\b`匹配所有的单词,并使用集合去重后返回单词种类数。在主程序中,读取文件内容后,逐行统计单词种类数并输出结果。
阅读全文