Python 爬虫 数据清洗 去掉 超链接
时间: 2024-03-06 08:03:17 浏览: 141
python爬虫数据保存到mongoDB的实例方法
5星 · 资源好评率100%
你可以使用 Python 的 Beautiful Soup 库来进行数据清洗,去掉超链接。以下是一个示例代码:
```python
from bs4 import BeautifulSoup
html = '<p><a href="https://www.example.com">Link</a> This is some text <a href="https://www.example.com">Another Link</a></p>'
soup = BeautifulSoup(html, 'html.parser')
for a in soup.find_all('a'):
a.replaceWithChildren()
clean_text = soup.get_text()
print(clean_text)
```
这段代码会输出 `Link This is some text Another Link`,即去掉了超链接后的文本。
阅读全文