用Python爬取百度百科行水膏的信息并抽取知识的代码
时间: 2024-03-19 16:41:49 浏览: 65
Python百度百科的爬取
5星 · 资源好评率100%
好的,以下是使用Python爬取百度百科行水膏的信息并抽取知识的代码:
```python
import requests
from bs4 import BeautifulSoup
# 定义要爬取的页面链接
url = 'https://baike.baidu.com/item/行水膏'
# 发送请求
response = requests.get(url)
# 使用BeautifulSoup解析网页
soup = BeautifulSoup(response.text, 'html.parser')
# 抽取知识
summary = soup.find('div', {'class': 'lemma-summary'}).get_text().strip()
# 输出结果
print(summary)
```
解释一下代码:
1. 首先导入了需要用到的库:requests和BeautifulSoup。
2. 定义了要爬取的页面链接。
3. 发送请求,得到页面的HTML代码。
4. 使用BeautifulSoup解析HTML代码,得到BeautifulSoup对象。
5. 使用find方法找到页面中`class`属性为`lemma-summary`的`div`标签,并获取其文本内容。
6. 使用`strip()`方法去除文本内容中的空格和换行符。
7. 输出抽取得到的知识。
阅读全文