首页帮我写一个python爬虫爬取网页的代码

帮我写一个python爬虫爬取网页的代码

时间: 2024-10-04 21:04:06 浏览: 75

在Python中，我们可以使用requests库获取网页内容，然后BeautifulSoup库解析HTML。以下是一个基础的Python爬虫代码示例，用于抓取网页上的文本： ```python # 导入所需的库 import requests from bs4 import BeautifulSoup # 定义要抓取的URL url = "https://www.example.com" # 发送GET请求获取网页内容 response = requests.get(url) # 检查请求是否成功 if response.status_code == 200: # 使用BeautifulSoup解析HTML soup = BeautifulSoup(response.text, 'html.parser') # 找到需要的内容，比如所有段落(p标签) paragraphs = soup.find_all('p') # 遍历并打印每个段落的内容 for para in paragraphs: print(para.get_text()) # 获取文本内容 else: print(f"请求失败，状态码：{response.status_code}") # 注意：实际使用时要遵守网站Robots协议，并处理可能出现的反爬机制 ```

阅读全文