Selenium定位核心技术：id, class, name与By.tagName()实践

需积分: 20 98 浏览量更新于2024-09-13 收藏 2KB TXT 举报

"本资源是一份关于Selenium定位技术在网页爬虫中的实用教程，主要介绍了如何使用Selenium库在不同场景下定位网页元素。主要内容包括通过id、class名、name属性以及tag name和link text定位元素的方法。下面将详细解析这些定位策略及其应用场景。" 1. **ID定位**: ID是HTML元素的唯一标识符，使用`By.id()`方法可以直接定位到具有特定ID的元素，如示例中的`gover_search_key`。这在页面中通常用于找到特定的输入框或按钮等元素，如`WebElement gover_search_key = driver.findElement(By.id("gover_search_key"));`。 2. **Class名定位**: 当元素类名重复较多时，可以利用`By.className()`方法通过类名批量查找元素，例如获取所有包含特定文本的`class-title`元素。代码展示了遍历并进一步定位内部子元素的过程，如`List<WebElement> Links = e.findElements(By.xpath(".//following-sibling::div[1]//div"));`。 3. **Name属性定位**: Name属性用于表单元素，如按钮，如`WebElement searchBox = driver.findElement(By.name("btnK"));`。这种方法适用于需要操作表单提交或其他与特定名称关联的动作。 4. **Tag Name定位**: 使用`By.tagName()`方法可以根据元素的标签名（如`button`）来查找元素。示例中的`SearchPageByTagName`类展示了如何获取页面上所有`button`元素的数量，这对于遍历或操作一组同类元素非常有用。 5. **Link Text定位**: `By.linkText()`方法通过链接的文本内容定位元素，适合查找页面上的超链接。这种方法可以避免依赖元素的其他属性，直接根据用户可读的链接文字进行搜索，如`List<WebElement> buttons = driver.findElements(By.tagName("button"));`中的linkText部分。本资源提供了Selenium定位元素的多种方法，包括id、class、name属性定位，以及针对特定标签名和链接文本的高级定位技巧。对于编写爬虫程序，理解并熟练运用这些定位策略至关重要，可以帮助提高爬虫的稳定性和效率。

例如class,name,id等进行定位
1.id定位：
WebElement gover_search_key = driver.findElement(By.id("gover_search_key"));//该方法可定位到网页中只要符合条件的任意标签

2.class定位：
List<WebElement> aboutLinks = driver.findElements(By.className("class-title"));
for (WebElement e : aboutLinks) {
if (e.getText().contains(code3)) {
System.err.println(e.getText());

List<WebElement> Links = e.findElements(By.xpath(".//following-sibling::div[1]//div"));
for (WebElement e1 : Links) {
if (e1.getText().contains(code2)) {
System.out.println("" + e1.getText());
txtT = e1.findElement(By.xpath(".//span//a"));

}
}
}
}

3.name定位：
WebElement searchBox = driver.findElement(By.name("btnK"));

4. By.tagName()

该方法可以通过元素的标签名称来查找元素。该方法跟之前两个方法的区别是，这个方法搜索到的元素通常不止一个，所以一般建议结合使用findElements方法来使用。比如我们现在要查找页面上有多少个button，就可以用button这个tagName来进行查找，代码如下：

下载后可阅读完整内容，剩余2页未读，立即下载

小小的我小小的梦小小的坚持

粉丝: 1

Selenium定位核心技术：id, class, name与By.tagName()实践

SeleniumIDE核心命令汇总与应用

Selenium实战Java爬虫教程与Chrome118.0.5955.0资源分享

掌握Selenium2：常见问题解决指南

selenium4.9.0定位方法

selenium资料汇总

C# Selenium 汇总

Selenium元素的常用操作方法分析

selenium2.0中常用的python函数汇总

Selenium精品文档

selenium_ide

最新资源