python 正则表达式 去重复值 保留第一次出现的
时间: 2023-07-29 18:13:25 浏览: 157
python 正则表达式
可以使用 Python 的 re 模块结合字典来实现去重,并保留第一次出现的值。
假设我们有一个列表 `data`,其中包含多个重复的元素。我们可以使用正则表达式来匹配每个元素,并将第一次出现的元素添加到一个字典中,最后从字典中取出所有值即可。
示例代码如下:
```python
import re
data = ['abc', 'def', 'abc', 'ghi', 'jkl', 'def']
# 定义一个空字典用于存储不重复的元素
unique_dict = {}
for item in data:
# 使用正则表达式匹配元素
match = re.match(r'(\w+)', item)
if match:
# 如果匹配成功,将第一次出现的元素添加到字典中
unique_dict.setdefault(match.group(), item)
# 从字典中取出所有值
unique_data = list(unique_dict.values())
print(unique_data)
```
输出结果为:
```
['abc', 'def', 'ghi', 'jkl']
```
在上面的示例代码中,我们使用了 `re.match(r'(\w+)', item)` 来匹配每个元素的第一个单词,并将第一次出现的元素添加到字典中。最后,我们从字典中取出所有值并输出,得到了不重复的元素列表。
阅读全文