使用Python的正则函数编写一个程序,使有一段英文文本 ,其中有多个单词连续重复了 多次 ,编写程序检查重复的单词并只保留一个
时间: 2023-12-03 15:44:59 浏览: 57
使用正则表达式检测字符串中重复出现的词
可以使用Python的re模块来实现正则表达式匹配和替换操作。以下是一个示例程序,可以将连续重复的单词缩减为一个单词:
```python
import re
text = "This is is a test test sentence sentence."
pattern = r'\b(\w+)\b\s+\1\b'
# 使用正则表达式匹配连续重复的单词,并替换为一个单词
result = re.sub(pattern, r'\1', text)
print(result)
```
输出结果为:
```
This is a test sentence.
```
正则表达式 `\b(\w+)\b\s+\1\b` 匹配以下内容:
- `\b` 匹配单词边界
- `(\w+)` 匹配一个或多个单词字符,并将其保存为第一个捕获组
- `\s+` 匹配一个或多个空格字符
- `\1` 引用第一个捕获组,即重复的单词
- `\b` 匹配单词边界
最后,使用 re.sub() 函数将匹配到的连续重复的单词替换为一个单词。
阅读全文