使用python的正则函数编写有一段英文文本 ,其中有多个单词连续重复了 多次 ,编写程序检查重复的单词并只保留一个
时间: 2023-12-03 21:44:53 浏览: 121
使用正则表达式检测字符串中重复出现的词
可以使用Python的re模块来实现正则表达式的匹配和替换。以下是一个示例代码:
```python
import re
# 定义一个文本字符串
text = "This is a test test string with multiple multiple repeated words words"
# 使用正则表达式查找重复单词并替换为单个单词
clean_text = re.sub(r'\b(\w+)(\s+\1)+\b', r'\1', text)
# 输出结果
print(clean_text)
```
运行该代码将输出:
```
This is a test string with multiple repeated words
```
代码解释:
- `\b` 表示单词边界,确保我们只匹配完整的单词。
- `(\w+)` 匹配一个或多个字母或数字的单词。
- `(\s+\1)+` 匹配一个或多个空格,后面跟着与之前匹配的单词相同的单词。
- `\1` 表示对之前匹配的单词的引用,用于替换成一个单独的单词。
这样就可以将文本中重复的单词替换为单个单词了。
阅读全文