首页selenium按照xpath获取当前网页的数据

selenium按照xpath获取当前网页的数据

时间: 2023-05-25 13:05:57 浏览: 325

selenium获取当前页面的url、源码、title的方法

此篇博客学习的api如标题，分别是： current_url　　　　获取当前页面的url； page_source 　　获取当前页面的源码； title　　　　　　获取当前页面的title；将以上方法按顺序练习一遍，效果如GIF： from selenium import webdriver from time import sleep sleep(2) driver = webdriver.Chrome() driver.get(https://www.baidu.com/) # 移动浏览器观看展示 driver.set_window_size(width=500, heig

以下是使用selenium按照xpath获取当前网页数据的基本步骤： 1. 导入selenium库 ```python from selenium import webdriver ``` 2. 启动浏览器并打开目标网页 ```python # 可以选择不同的浏览器 browser = webdriver.Chrome() browser.get("http://www.example.com") ``` 3. 找到目标数据所在的网页元素 ```python # 通过xpath查找元素 element = browser.find_element_by_xpath("//div[@class='example']") ``` 4. 提取需要的数据 ```python # 获取元素的文本 text = element.text ``` 完整的代码示例： ```python from selenium import webdriver # 启动浏览器并打开目标网页 browser = webdriver.Chrome() browser.get("http://www.example.com") # 找到目标数据所在的网页元素 element = browser.find_element_by_xpath("//div[@class='example']") # 提取需要的数据 text = element.text # 关闭浏览器 browser.quit() # 输出结果 print(text) ``` 注意：使用selenium自动化测试时，一定要遵守网站的使用规则，不要频繁地刷取页面、爬取网站数据，以免引起不必要的麻烦。

阅读全文