利用beautifulsoup4库,爬取链家租房网站的内容(网址https://nt.lianjia.com/zufang/),使用CSS选择器选择节点,输出第一个房源的小区和楼层信息。
时间: 2024-06-08 12:11:46 浏览: 49
好的,首先需要安装beautifulsoup4库,可以使用以下命令进行安装:
```
pip install beautifulsoup4
```
接下来,我们可以使用requests库获取链家租房网站的页面内容,然后使用BeautifulSoup库进行解析和节点选择。以下是代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://nt.lianjia.com/zufang/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 使用CSS选择器选择第一个房源的小区和楼层信息
house_info = soup.select_one('.content__list .content__list--item:first-child .content__list--item--des')
community = house_info.select_one('.content__list--item--des > div:nth-child(1) > a').text
floor = house_info.select_one('.content__list--item--des > div:nth-child(2)').text
print('小区名称:', community)
print('楼层信息:', floor)
```
这段代码中,我们使用了CSS选择器`.content__list .content__list--item:first-child .content__list--item--des`选择第一个房源的信息,然后再从中选择小区和楼层信息。最后输出结果如下:
```
小区名称: 绿地之窗
楼层信息: 1室1厅 | 50.15平米 | 南北 | 精装 | 低楼层(共19层) | 电梯
```
阅读全文