python实现敏感词替换
时间: 2023-11-03 14:55:45 浏览: 221
你可以使用正则表达式来实现敏感词替换。首先,你需要准备一个包含所有敏感词的列表。然后,使用 re 模块中的 sub() 函数来替换文本中的敏感词。
下面是一个简单的示例代码:
```python
import re
def replace_sensitive_words(text, sensitive_words, replacement='***'):
# 构建正则表达式模式
pattern = re.compile(r'\b({})\b'.format('|'.join(map(re.escape, sensitive_words))), re.IGNORECASE)
# 替换敏感词
replaced_text = pattern.sub(replacement, text)
return replaced_text
# 示例用法
sensitive_words = ['敏感词1', '敏感词2', '敏感词3']
text = '这是一段包含敏感词1和敏感词2的文本。'
replaced_text = replace_sensitive_words(text, sensitive_words)
print(replaced_text)
```
在上面的代码中,replace_sensitive_words() 函数接受三个参数:待处理的文本、敏感词列表和替换字符串(可选,默认为 '***')。函数首先构建一个正则表达式模式,其中使用了 `\b` 来确保只匹配完整的单词。然后,使用 sub() 函数将文本中的敏感词替换为指定的替换字符串。最后,返回替换后的文本。
注意:这只是一个简单的示例,实际应用中可能需要考虑更复杂的情况,如多语言支持、部分匹配等。
阅读全文