python正则去除url
时间: 2024-06-08 15:07:35 浏览: 226
可以使用正则表达式来去除 URL,具体操作如下:
```python
import re
text = "这是一段包含 URL 的文本,例如 https://www.example.com 和 http://www.example.com/path。"
url_pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
# 使用 sub 方法将 URL 替换为空字符串
clean_text = url_pattern.sub('', text)
print(clean_text)
```
上述代码中,我们使用了正则表达式 `http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+` 来匹配 URL。然后使用 `sub` 方法将其替换为空字符串,从而实现了去除 URL 的功能。
阅读全文