使用re模块,有一段英文文本,其中有单词连续出现了两次,编写程序检查重复的单词并
时间: 2023-08-22 16:05:05 浏览: 348
易语言数据库检查重复字段模块源码
去除其中一个。
可以使用正则表达式 `\b(\w+)\b\s+\b\1\b` 匹配重复出现的单词,并通过 `re.sub()` 函数将其中一个单词去除。
以下是示例代码:
```python
import re
text = "This is is a sample text for testing testing purposes."
pattern = r'\b(\w+)\b\s+\b\1\b'
result = re.sub(pattern, r'\1', text)
print(result)
```
运行结果为:
```
This is a sample text for testing purposes.
```
可以看到,重复出现的单词 "is" 和 "testing" 中的一个被去除了。
阅读全文