webdriver 获取网页原文
时间: 2024-10-20 18:19:32 浏览: 15
webdriver打开网页.py
WebDriver 是一种用于自动化浏览器操作的工具,主要用于软件测试,特别是针对Web应用程序的端到端测试。获取网页源代码通常不是直接通过 WebDriver API 来完成的,而是通过浏览器本身提供的功能或者特定的语言库。
如果你是在 Python 中使用 Selenium(一个流行的 WebDriver 驱动程序库),你可以这样做:
```python
from selenium import webdriver
# 创建一个新的浏览器实例
driver = webdriver.Chrome() # 或者替换为你使用的浏览器驱动
# 访问网站
driver.get("http://example.com")
# 等待页面加载完成后获取源代码
page_source = driver.page_source
print(page_source)
# 关闭浏览器
driver.quit()
```
在这里,`page_source` 就是网页的原始HTML内容。如果你想在其他语言环境中获取源代码,比如 JavaScript(使用 Puppeteer),示例如下:
```javascript
const puppeteer = require('puppeteer');
async function getPageSource(url) {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto(url);
const source = await page.content();
browser.close();
return source;
}
// 调用函数获取指定URL的源代码
const url = 'http://example.com';
const source = await getPageSource(url);
console.log(source);
```
阅读全文