python爬虫爬取百度百科
时间: 2023-10-09 16:15:28 浏览: 421
Python百度百科的爬取
5星 · 资源好评率100%
以下是一个简单的 Python 爬虫示例,用于爬取百度百科上的某个页面的内容:
```python
import requests
from bs4 import BeautifulSoup
url = "https://baike.baidu.com/item/Python/407313"
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
# 获取页面标题
title = soup.find("title").text
print(title)
# 获取页面正文
content = soup.find("div", class_="lemma-summary").text
print(content)
```
这个示例使用了 requests 库来发起 HTTP 请求,使用了 BeautifulSoup 库来解析 HTML 页面。它首先发送一个 GET 请求到指定的 URL,并将响应内容传递给 BeautifulSoup 对象。然后,它使用 find 方法查找页面标题和正文的元素,并将它们的文本内容打印出来。
阅读全文