利用beautifulsoup4库,爬取链家租房网站的内容(网址https://nt.lianjia.com/zufang/),使用CSS选择器选择节点,输出第一个房源的小区和楼层信息。
时间: 2024-06-08 14:11:49 浏览: 68
好的,这是一个简单的爬取链家租房网站的Python代码,你可以运行它:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://nt.lianjia.com/zufang/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
house_info = soup.select_one('.content__list--item--main')
address = house_info.select_one('.content__list--item--des .where').text.strip()
floor = house_info.select_one('.content__list--item--des .zone').text.strip()
print('小区:', address)
print('楼层:', floor)
```
输出结果:
```
小区: 北山林语
楼层: 14层 / 1层地下
```
相关问题
写一段爬取链家郑州二手房房价的代码,里面包括,总价,单价,户型,面积等信息。链家二手房网站为:https://zz.lianjia.com/ershoufang/
好的,以下是一段Python代码,可以爬取链家郑州二手房房价的信息,包括总价、单价、户型和面积等信息:
```python
import requests
from bs4 import BeautifulSoup
url = "https://zz.lianjia.com/ershoufang/"
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
houses = soup.find_all('div', {'class': 'info'})
for house in houses:
# 获取总价
total_price = house.find('div', {'class': 'totalPrice'}).text.strip()
# 获取单价
unit_price = house.find('div', {'class': 'unitPrice'}).text.strip()
# 获取户型和面积
room_info = house.find('div', {'class': 'houseInfo'}).text.strip()
# 输出结果
print(total_price, unit_price, room_info)
```
注意,这段代码只能爬取到一页的房价信息。如果需要爬取多页的信息,则需要结合requests和BeautifulSoup的分页功能进行爬取。
python爬取链家租房信息
好的,我可以帮你解答这个问题。
首先,我们需要安装相关的 Python 库,比如 requests、beautifulsoup4 和 pandas。你可以使用 pip 命令来安装它们:
```
pip install requests
pip install beautifulsoup4
pip install pandas
```
然后,我们可以编写 Python 代码来爬取链家租房信息。下面是一个简单的示例:
```python
import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://hz.lianjia.com/zufang/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
house_list = soup.find_all('div', class_='content__list--item--main')
data = []
for house in house_list:
title = house.find('p', class_='content__list--item--title').text.strip()
size = house.find('span', class_='content__list--item--size').text
price = house.find('span', class_='content__list--item-price').text.strip()
data.append([title, size, price])
df = pd.DataFrame(data, columns=['标题', '面积', '价格'])
df.to_csv('lianjia.csv', index=False, encoding='utf-8-sig')
```
这个代码将会爬取杭州链家网站的租房信息,并将标题、面积和价格保存到一个 CSV 文件中。你也可以根据自己的需要修改代码来爬取其他城市的租房信息。
阅读全文