selenium获取当前页面html
时间: 2023-04-24 19:02:15 浏览: 138
使用Selenium可以通过以下代码获取当前页面的HTML:
```python
from selenium import webdriver
# 创建浏览器对象
browser = webdriver.Chrome()
# 打开网页
browser.get('https://www.baidu.com')
# 获取当前页面的HTML
html = browser.page_source
# 输出HTML
print(html)
# 关闭浏览器
browser.quit()
```
其中,`browser.page_source`方法可以获取当前页面的HTML。
相关问题
selenium 下载当前页面
你可以使用Selenium来下载当前页面的源代码。以下是一个Python示例代码:
```python
from selenium import webdriver
# 初始化Selenium webdriver
driver = webdriver.Chrome()
# 打开网页
driver.get("https://www.example.com")
# 获取网页源代码
html = driver.page_source
# 将源代码保存到文件
with open("page_source.html", "w", encoding="utf-8") as f:
f.write(html)
# 关闭浏览器
driver.quit()
```
这个代码会使用Chrome浏览器打开一个网页,获取网页源代码,将其保存到名为`page_source.html`的文件中,并关闭浏览器。你可以根据需要修改代码来适应你的需求。
python selenium 获取页面内容
要使用Python Selenium获取页面内容,您可以使用`driver`对象的`page_source`属性来获取当前页面的HTML源代码。以下是一个简单的示例:
```python
from selenium import webdriver
# 创建浏览器实例
driver = webdriver.Chrome()
# 导航到网页
driver.get('https://www.example.com')
# 获取页面内容
page_source = driver.page_source
# 打印页面内容
print(page_source)
# 关闭浏览器
driver.quit()
```
在上述示例中,我们使用了Chrome浏览器作为示例,您可以根据需要更换为其他浏览器(例如Firefox、IE等)。`driver.page_source`返回的是当前页面的完整HTML源代码,您可以根据需要进行后续处理,例如提取特定元素、执行文本分析等。
请注意,使用Selenium获取页面内容时,浏览器会完全加载和解析页面,这可能会花费一些时间。因此,如果您只需要获取页面的某个特定部分,可以使用Selenium提供的其他方法来查找和提取元素,而不是获取整个页面的源代码。
希望对您有所帮助!如有任何其他问题,请随时提问。