python提取txt中所有英语单词
时间: 2023-11-11 18:03:21 浏览: 192
extract-dictionary-np:提取字典
要提取txt文件中所有英语单词,你可以使用Python的正则表达式模块re来匹配所有的英语单词,就像我在上一个回答中给出的示例一样。
具体来说,你可以使用re.findall()函数来匹配所有符合条件的单词,并将它们存储在一个列表中,例如:
```python
import re
with open("file.txt", "r") as f:
content = f.read()
words = re.findall(r'\b\w+\b', content)
```
这个正则表达式匹配以单词边界(\b)开始和结束的一个或多个字母(\w),然后使用re.findall()函数找到所有匹配的字符串。
现在,你可以对匹配到的单词进行进一步的处理,例如去除重复单词、计算出现次数等等。如果你只是想查看提取到的单词,可以直接打印这个列表:
```python
print(words)
```
如果你想将这些单词保存到一个新的文件中,可以使用以下代码:
```python
with open("words.txt", "w") as f:
f.write("\n".join(words))
```
这个代码将列表中的单词使用换行符连接成一个字符串,并将其写入一个名为“words.txt”的新文件中。
阅读全文