selenium获取a标签下的href的值

时间: 2024-03-03 18:48:16 浏览: 208

Selenium切换窗口句柄及调用Chrome浏览器.docx

### Selenium切换窗口句柄及调用Chrome浏览器 #### 一、调用Chrome浏览器在进行Web自动化测试或者数据抓取时，我们常常需要利用到不同的浏览器。本篇内容主要介绍了如何利用Selenium来调用Chrome浏览器，并进行了示例演示。 ##### 1.1 使用Firefox浏览器抓取首页导航栏信息在初始阶段，作者使用了Firefox浏览器来抓取某个网站（例如csdn.net）的首页导航栏信息。具体做法如下： ```python #coding=utf-8 import os from selenium import webdriver # 打开火狐浏览器 driver = webdriver.Firefox() url = "http://www.csdn.net/" driver.get(url) # XPath路径定位导航栏 elem_dh = driver.find_elements_by_xpath("//div[@class='menu']/ul/li/a") for elem in elem_dh: print(elem.text) # 获取正文 print(elem.get_attribute('href')) # 获取属性值 ``` 这里的关键在于利用XPath选择器定位页面元素。XPath是一种用于在XML文档中查找信息的语言，同样适用于HTML文档。`find_elements_by_xpath`方法能够根据指定的XPath表达式查找多个页面元素。 ##### 1.2 转换至Chrome浏览器接下来，为了实现从Firefox到Chrome的切换，我们需要在电脑上安装Chrome浏览器，并且确保已经配置了ChromeDriver（Chrome的WebDriver驱动程序）。以下是具体的步骤： 1. **安装ChromeDriver**：下载对应版本的ChromeDriver并放置在特定路径（例如："C:\Program Files (x86)\Google\Chrome\Application\"）。 2. **设置环境变量**：将ChromeDriver的路径添加到系统环境变量中。代码示例如下： ```python #coding=utf-8 import os from selenium import webdriver # 指定ChromeDriver路径 chromedriver = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe" os.environ["webdriver.chrome.driver"] = chromedriver # 创建Chrome浏览器实例 driver = webdriver.Chrome(chromedriver) url = "http://www.csdn.net/" driver.get(url) # XPath路径定位导航栏 elem_dh = driver.find_elements_by_xpath("//div[@class='menu']/ul/li/a") for elem in elem_dh: print(elem.text) # 获取正文 print(elem.get_attribute('href')) # 获取属性值 ``` 通过这种方式，我们可以在同一段代码中切换不同浏览器进行操作，这对于自动化测试和数据抓取来说是非常有用的。 #### 二、获取当前句柄并切换窗口句柄在使用Selenium进行自动化测试时，经常会遇到页面打开新窗口或者弹出对话框的情况。为了处理这些新窗口，我们需要掌握如何获取当前窗口的句柄，并能够在多个窗口之间进行切换。 ##### 2.1 获取窗口句柄我们需要获取当前浏览器窗口的句柄。这可以通过`driver.current_window_handle`来完成。该方法返回的是当前窗口的唯一标识符。 ##### 2.2 切换窗口句柄当新窗口打开后，我们需要将焦点从当前窗口切换到新打开的窗口。这可以通过以下方式实现： ```python # 获取所有窗口的句柄 handles = driver.window_handles # 切换到新的窗口 for handle in handles: if handle != current_handle: # 假设current_handle是当前窗口的句柄 driver.switch_to.window(handle) break ``` 以上就是关于如何使用Selenium调用Chrome浏览器以及如何获取和切换窗口句柄的主要内容。这些技术对于Web自动化测试和数据抓取都是非常重要的基础技能。

可以使用以下代码来获取a标签下的href值： ```python from selenium import webdriver # 创建浏览器对象 browser = webdriver.Chrome() # 打开网页 browser.get("https://www.example.com") # 获取a标签 a_tag = browser.find_element_by_tag_name("a") # 获取a标签的href属性值 href_value = a_tag.get_attribute("href") # 输出href属性值 print(href_value) # 关闭浏览器 browser.quit() ``` 其中，`get_attribute()` 方法可以用来获取元素的属性值。在这里，我们使用 `get_attribute("href")` 获取a标签的href属性值。

阅读全文

selenium获取a标签下的href的值

相关推荐

Selenium爬取中国大学MOOC的Python课程数据

Selenium自动化测试：元素定位与实战技巧

selenium获取a标签的href

selenium 获取指定节点的href 属性

selenium爬虫获取html中ul标签下所有a标签的href属性

selenium获取href里的链接

Python+selenium 获取一组元素属性值的实例

selenium-baiduwenku:selenium 爬取百度文库

Python爬虫进阶：利用Selenium解析动态网页，获取更多数据

selenium a标签

Python Selenium获取网页超链接

闫非 彭大魔 如何通过selenium获取以上代码中的文本

用selenium库和requests库爬取潇湘书院的数据，要用到正则表达式，行动中包含获取完整数据榜单，获取h4标签，获取h2标签等

selenium获取当前网页多条xpath对应的数据

selenium爬虫获取html中标签中属性

对于翻页按钮为<ahref="#">下一页，如何使用selenium如何翻页的爬虫代码

在一个里面有很多个标签，打印里某个已知XPath的标签以后的所有超链接。用selenium和By函数

Selenium 打开页面后 怎么用xpath 获取内容

用bs4获取动态网页中的href

最新推荐

JavaScript实现的高效pomodoro时钟教程

管理建模和仿真的文件

【WebLogic客户端兼容性提升秘籍】：一站式解决方案与实战案例

使用jupyter读取文件“近5年考试人数.csv”，绘制近5年高考及考研人数发展趋势图，数据如下（单位：万人）。

CMake 3.25.3版本发布：程序员必备构建工具

"互动学习：行动中的多样性与论文攻读经历"

数字信号处理全攻略：掌握15个关键技巧，提升你的处理效率

给定不超过6的正整数A，考虑从A开始的连续4个数字。请输出所有由它们组成的无重复数字的3位数。编写一个C语言程序

直流无刷电机控制技术项目源码集合

关系数据表示学习

闫非彭大魔如何通过selenium获取以上代码中的文本

Selenium 打开页面后怎么用xpath 获取内容