pychram编写一个爬取http://data.cityhouse.cn/rank/index.html?网页上房价信息
时间: 2024-01-24 22:03:49 浏览: 128
好的,以下是一个简单的爬虫程序,可以爬取 http://data.cityhouse.cn/rank/index.html 网站上的房价信息:
```python
import requests
from bs4 import BeautifulSoup
url = "http://data.cityhouse.cn/rank/index.html"
# 发送HTTP请求
response = requests.get(url)
# 解析HTML页面
soup = BeautifulSoup(response.text, "html.parser")
# 获取房价信息
data = []
for tr in soup.find_all("tr"):
tds = tr.find_all("td")
if len(tds) == 5:
city = tds[0].get_text().strip()
price = tds[1].get_text().strip()
change = tds[2].get_text().strip()
ratio = tds[3].get_text().strip()
data.append((city, price, change, ratio))
# 输出数据
for d in data:
print(d)
```
运行上述代码,可以输出网站上的所有城市的房价信息。注意,网站可能会对频繁的爬虫请求进行限制,因此应该适当控制爬虫的速度,避免给网站造成过大的负担。
阅读全文