首页python链家网二手房爬虫

python链家网二手房爬虫

时间: 2023-09-30 14:06:41 浏览: 131

您好！针对您的问题，我可以为您提供一个基本的Python链家网二手房爬虫的代码示例。在开始之前，请确保您已经安装了Python和相关的依赖库，如requests和BeautifulSoup。下面是一个简单的爬虫示例，用于从链家网获取二手房信息： ```python import requests from bs4 import BeautifulSoup def get_house_info(url): response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') house_list = soup.find_all('div', class_='info clear') for house in house_list: title = house.find('div', class_='title').text.strip() info = house.find('div', class_='address').text.strip() price = house.find('div', class_='price').text.strip() print('标题:', title) print('信息:', info) print('价格:', price) print('-' * 30) def main(): base_url = 'https://bj.lianjia.com/ershoufang/pg{}/' for page in range(1, 3): # 爬取前3页的数据 url = base_url.format(page) get_house_info(url) if __name__ == '__main__': main() ``` 以上代码会爬取链家网北京地区前3页的二手房信息，并将标题、信息和价格打印出来。您可以根据自己的需求对代码进行修改和扩展。值得注意的是，爬取网站数据时，请遵守网站的相关规定并尊重数据的版权。另外，爬虫的频率和爬取的页数也需要适度，以免给网站带来过大的负担或触发反爬虫机制。

阅读全文