Python实现敏感词过滤
时间: 2024-04-06 20:27:42 浏览: 185
基于dfa的python敏感词过滤算法
Python可以通过多种方式实现敏感词过滤,以下是其中一种常见的实现方式:
1. 使用正则表达式:可以使用re模块中的正则表达式函数来匹配敏感词并进行替换或删除。首先,将敏感词存储在一个列表或者文件中,然后使用re.sub()函数将匹配到的敏感词替换为指定的字符或者删除。
示例代码如下:
```python
import re
def filter_sensitive_words(text, sensitive_words):
for word in sensitive_words:
pattern = re.compile(r'\b' + word + r'\b', re.IGNORECASE)
text = re.sub(pattern, '*' * len(word), text)
return text
sensitive_words = ['敏感词1', '敏感词2', '敏感词3']
text = '这是一段包含敏感词1和敏感词2的文本。'
filtered_text = filter_sensitive_words(text, sensitive_words)
print(filtered_text)
```
输出结果为:`这是一段包含***和***的文本。`
阅读全文