首页pychram编写一个爬取http://data.cityhouse.cn/rank/index.html?网页上房价信息

pychram编写一个爬取http://data.cityhouse.cn/rank/index.html?网页上房价信息

时间: 2024-01-24 22:03:49 浏览: 128

好的，以下是一个简单的爬虫程序，可以爬取 http://data.cityhouse.cn/rank/index.html 网站上的房价信息： ```python import requests from bs4 import BeautifulSoup url = "http://data.cityhouse.cn/rank/index.html" # 发送HTTP请求 response = requests.get(url) # 解析HTML页面 soup = BeautifulSoup(response.text, "html.parser") # 获取房价信息 data = [] for tr in soup.find_all("tr"): tds = tr.find_all("td") if len(tds) == 5: city = tds[0].get_text().strip() price = tds[1].get_text().strip() change = tds[2].get_text().strip() ratio = tds[3].get_text().strip() data.append((city, price, change, ratio)) # 输出数据 for d in data: print(d) ``` 运行上述代码，可以输出网站上的所有城市的房价信息。注意，网站可能会对频繁的爬虫请求进行限制，因此应该适当控制爬虫的速度，避免给网站造成过大的负担。

阅读全文