帮我写一个简单的爬虫代码,能够爬取到https://cd.newhouse.fang.com/xfbusiness/deal.htm,该网站的数据
时间: 2023-06-27 10:06:58 浏览: 75
一个简单的爬虫代码,可以帮助大家入门
好的,以下是一个简单的 Python 爬虫代码,可以爬取到目标网站的数据:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://cd.newhouse.fang.com/xfbusiness/deal.htm'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find('table', class_='dataList')
for tr in table.find_all('tr'):
for td in tr.find_all('td'):
print(td.text.strip(), end='\t')
print()
```
这个代码使用 requests 库发送请求,获取网页的 HTML 内容,并使用 BeautifulSoup 库对 HTML 进行解析。然后找到包含数据的表格,遍历表格中的每一行和每一列,输出每个单元格的文本内容。你可以根据需要修改代码,将数据保存到文件或数据库中。
阅读全文