playwright 获取信息 存储
时间: 2023-09-29 09:03:03 浏览: 71
信息的获取
您好!如果您想使用 Playwright 获取网页信息并进行存储,可以按照以下步骤进行:
1. 安装 Playwright 库:在命令行中输入 `npm install playwright`,即可安装 Playwright 库。
2. 编写代码:使用 Playwright 的 API,可以打开网页、获取元素信息、填写表单、点击按钮等。您可以根据需要编写代码,实现获取网页信息的功能。
3. 存储数据:在获取到网页信息后,可以将其存储到本地文件或数据库中。您可以使用 Node.js 提供的文件系统(fs)模块或数据库库(如 MongoDB)进行存储操作。
下面是一个示例代码,用于获取百度搜索结果页面的所有链接,并将其存储到本地文件中:
```javascript
const { chromium } = require('playwright');
const fs = require('fs');
(async () => {
const browser = await chromium.launch();
const page = await browser.newPage();
await page.goto('https://www.baidu.com/s?wd=playwright');
const links = await page.$$eval('a', (elements) => elements.map((el) => el.href));
fs.writeFileSync('links.txt', links.join('\n'));
await browser.close();
})();
```
该代码使用 Playwright 打开百度搜索结果页面,获取所有链接,将其写入本地文件 `links.txt` 中,并最后关闭浏览器。
阅读全文