需求:爬取网址中的信息 https://www.58.com/ershoufang/
时间: 2023-10-11 08:14:15 浏览: 121
好的,这个任务可以使用 Python 中的 requests 和 BeautifulSoup 模块来实现。以下是一个简单的爬虫代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = "https://www.58.com/ershoufang/"
# 发送 GET 请求
response = requests.get(url)
# 解析 HTML
soup = BeautifulSoup(response.text, "html.parser")
# 找到所有房源信息的 div 元素
house_divs = soup.find_all("div", class_="property-module")
# 遍历每个房源 div 元素,提取信息
for house_div in house_divs:
# 房源标题
title = house_div.find("a", class_="property-title").text.strip()
# 房源价格
price = house_div.find("span", class_="property-price-total").text.strip()
# 房源面积
area = house_div.find("span", class_="property-area").text.strip()
# 房源地址
address = house_div.find("p", class_="property-address").text.strip()
# 输出房源信息
print(title)
print(price)
print(area)
print(address)
print("=" * 50)
```
这个示例代码会爬取 https://www.58.com/ershoufang/ 页面上的所有房源信息,并输出每个房源的标题、价格、面积和地址。你可以根据自己的需求修改代码来提取其他信息。同时请注意,爬取网站信息时应遵守相关法律法规,不得进行非法爬取行为。
阅读全文