用selenium 打开百度搜多外星人并抓取子页面标题
时间: 2023-06-14 10:05:11 浏览: 128
好的,以下是Python代码实现:
```python
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
# 创建浏览器对象
driver = webdriver.Chrome()
# 打开百度首页
driver.get("https://www.baidu.com")
# 定位搜索框并输入关键字
search_box = driver.find_element_by_name("wd")
search_box.send_keys("外星人")
search_box.send_keys(Keys.RETURN)
# 点击第一个搜索结果
first_result = driver.find_element_by_css_selector("div#content_left a")
first_result.click()
# 获取子页面标题
child_title = driver.title
# 输出子页面标题
print(child_title)
# 关闭浏览器
driver.quit()
```
这段代码首先创建了一个Chrome浏览器对象,然后打开百度首页并在搜索框中输入关键字“外星人”,按下回车键进行搜索。接着,代码通过CSS选择器定位到搜索结果的第一个链接,并点击进入子页面。最后,代码获取子页面的标题并输出。最后,关闭浏览器对象。
相关问题
selenium3抓取百度
Selenium是一个用于自动化浏览器操作的工具,可以模拟用户在浏览器中的行为。Selenium 3是Selenium的一个版本,用于抓取网页数据。
要使用Selenium 3抓取百度,首先需要安装Selenium库和浏览器驱动程序。你可以通过以下步骤来实现:
1. 安装Selenium库:在Python环境中使用pip命令安装Selenium库。可以使用以下命令进行安装:
```
pip install selenium
```
2. 下载浏览器驱动程序:Selenium需要与特定的浏览器驱动程序配合使用。对于Chrome浏览器,你可以从ChromeDriver官方网站(https://sites.google.com/a/chromium.org/chromedriver/)下载对应版本的驱动程序,并将其添加到系统的PATH环境变量中。
3. 编写Python代码:下面是一个使用Selenium 3抓取百度首页的示例代码:
```python
from selenium import webdriver
# 创建Chrome浏览器实例
driver = webdriver.Chrome()
# 打开百度首页
driver.get("https://www.baidu.com")
# 查找搜索框并输入关键字
search_box = driver.find_element_by_id("kw")
search_box.send_keys("CSDN")
# 提交搜索表单
search_box.submit()
# 等待搜索结果加载完成
driver.implicitly_wait(10)
# 获取搜索结果页面的标题
title = driver.title
print("搜索结果页面标题:", title)
# 关闭浏览器
driver.quit()
```
这段代码使用Chrome浏览器驱动程序创建了一个浏览器实例,然后打开百度首页,输入关键字并提交搜索表单。最后获取搜索结果页面的标题并打印出来。你可以根据自己的需求进行修改和扩展。
阅读全文