使用re模块和应用函数,有一段英文文本,其中有单词连续出现了两次,编写程序检查重复的单词并只保留一个
时间: 2023-12-03 18:43:21 浏览: 86
易语言数据库检查重复字段模块源码
可以使用re模块中的正则表达式来实现这个功能,具体步骤如下:
1. 导入re模块
```python
import re
```
2. 定义一个函数,接收一个英文文本字符串作为参数,并返回去重后的字符串
```python
def remove_duplicate_words(text):
# 定义正则表达式,匹配连续出现的单词
pattern = re.compile(r'\b(\w+)\b\s+\1\b', re.IGNORECASE)
# 使用sub函数替换匹配到的内容,只保留第一个单词
new_text = re.sub(pattern, r'\1', text)
return new_text
```
3. 调用函数并测试
```python
text = 'This is is a test test sentence sentence.'
new_text = remove_duplicate_words(text)
print(new_text)
```
输出结果为:
```
This is a test sentence.
```
可以看到,函数成功去重并保留了第一个单词。
阅读全文