python利用正则表达式设定敏感词汇,并对敏感词汇进行替换输出
时间: 2023-06-17 16:02:45 浏览: 108
基于python实现检索标记敏感词并输出
首先,需要准备一个敏感词汇列表,假设是一个包含敏感词汇的列表 `sensitive_words`。然后,可以使用 Python 中的 `re` 模块来进行正则表达式的匹配和替换。
以下是一个示例代码,可以将字符串 `text` 中的敏感词汇替换为 `*`:
```python
import re
sensitive_words = ["敏感词汇1", "敏感词汇2", "敏感词汇3"]
text = "这是一段包含敏感词汇1和敏感词汇2的文本。"
# 构造正则表达式
pattern = re.compile('|'.join(sensitive_words))
# 进行替换
new_text = pattern.sub('*', text)
# 输出结果
print(new_text)
```
输出结果为:
```
这是一段包含********和********的文本。
```
其中,`re.compile()` 方法用于将敏感词汇列表转换为一个正则表达式模式,`'|'.join(sensitive_words)` 将敏感词汇列表中的词汇用 `|` 连接起来,表示匹配其中任意一个词汇。`pattern.sub('*', text)` 则用 `*` 替换匹配到的敏感词汇。
阅读全文