Selenium 获取嵌套网页表格
时间: 2024-03-20 09:15:17 浏览: 74
要获取嵌套网页上的表格,可以使用Selenium中的find_elements_by_xpath方法来定位表格元素,然后使用循环来遍历表格中的行和列,以获取表格中的数据。
下面是一个示例代码,用于获取一个嵌套在iframe中的表格数据:
```python
from selenium import webdriver
# 启动浏览器并进入目标页面
driver = webdriver.Chrome()
driver.get("http://example.com/page-with-iframe")
# 切换到iframe中
iframe = driver.find_element_by_xpath("//iframe[@id='my-iframe']")
driver.switch_to.frame(iframe)
# 找到表格元素并遍历行和列
table = driver.find_element_by_xpath("//table[@id='my-table']")
rows = table.find_elements_by_tag_name('tr')
for row in rows:
cols = row.find_elements_by_tag_name('td')
for col in cols:
print(col.text)
# 切换回主页面
driver.switch_to.default_content()
# 关闭浏览器
driver.quit()
```
在上面的代码中,我们首先启动Chrome浏览器,并打开一个包含嵌套表格的页面。然后,我们使用find_element_by_xpath方法找到iframe元素,并使用switch_to方法切换到iframe中。接着,我们使用相同的方法找到表格元素,并遍历表格中的行和列。最后,我们使用switch_to.default_content方法切换回主页面,并关闭浏览器。
注意,在使用Selenium获取嵌套表格时,需要先切换到iframe中,才能定位到其中的元素。否则,将无法找到嵌套表格中的任何元素。
阅读全文