用python爬取当前网页的数据
时间: 2023-09-14 12:14:22 浏览: 73
python 爬取网页
抱歉,作为AI语言模型,我没有权限直接爬取网页数据。我能提供的是Python爬虫的一般步骤:
1. 导入所需的库,如requests、BeautifulSoup等。
2. 发送HTTP请求,获取网页的HTML源代码。
3. 解析HTML源代码,提取所需的数据。
4. 存储数据。
以下是一个简单的示例代码,用于获取网页的标题和正文:
``` python
import requests
from bs4 import BeautifulSoup
# 发送HTTP请求,获取网页的HTML源代码
url = 'https://www.example.com'
response = requests.get(url)
html = response.content
# 解析HTML源代码,提取所需的数据
soup = BeautifulSoup(html, 'html.parser')
title = soup.title.text
body = soup.body.text
# 存储数据
with open('data.txt', 'w', encoding='utf-8') as f:
f.write(f'Title: {title}\n\nBody: {body}')
```
请注意,爬取网页数据时需要遵守网站的使用规则,不得进行非法行为。
阅读全文