通过selenium webdriver定位输入文本框元素的位置及“搜索”按钮元素的位置。后模拟用户在输入文本框内输入关键词“房山”后,单击“搜索”按钮。最后采集并解析与房山相关的二手房源信息数据,并输出在控制台上。python代码,用百度搜索
时间: 2024-10-22 10:06:30 浏览: 51
在Python中,你可以使用Selenium WebDriver库配合BeautifulSoup或lxml等HTML解析库来完成这个任务。以下是一个简化的示例代码,假设你已经在环境中安装了Selenium、ChromeDriver以及需要的解析库:
```python
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
# 初始化浏览器
driver = webdriver.Chrome()
# 让浏览器打开百度搜索页面
driver.get("https://www.baidu.com")
# 定位到搜索框
search_input = driver.find_element_by_name("kw") # 如果搜索框name属性为"kw"
# 或者使用CSS选择器定位
# search_input = driver.find_element_by_css_selector("#kw")
# 输入关键词 "房山"
search_input.send_keys("房山")
search_input.send_keys(Keys.RETURN) # 模拟按下回车键提交搜索
# 等待页面加载完成,然后抓取页面内容
page_source = driver.page_source
soup = BeautifulSoup(page_source, 'lxml')
# 解析二手房源信息数据(这里假设数据在HTML中有一部分符合特定结构,比如class="property")
房源信息列表 = soup.select(".property")
# 遍历房源信息
for info in房源信息列表:
title = info.select_one('.title').text # 获取标题
price = info.select_one('.price').text # 获取价格
print(f"标题:{title}, 价格:{price}")
# 关闭浏览器
driver.quit()
阅读全文