p y thon爬虫抓取网页
时间: 2024-01-17 18:03:07 浏览: 67
python 爬取网页
使用 Python 编写爬虫可以用许多库,比如 requests, BeautifulSoup, Scrapy 等等。以下是一个简单的示例代码,使用 requests 和 BeautifulSoup 来抓取一个网页并解析其中的数据:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 解析网页,获取需要的信息
# ...
```
首先,使用 requests 库的 get 方法获取网页的 HTML 内容,然后使用 BeautifulSoup 库将 HTML 解析成可操作的对象。随后,可以使用 BeautifulSoup 的各种方法来解析 HTML,获取需要的信息。
阅读全文