playwright 获取信息 存储
时间: 2023-09-13 09:07:21 浏览: 79
可以使用 Playwright 的 API 来获取页面上的信息,并将其存储在本地或远程服务器上。以下是一些相关的示例代码:
1. 获取页面上的文本信息并将其存储在本地文本文件中
```javascript
const { chromium } = require('playwright');
(async () => {
const browser = await chromium.launch();
const page = await browser.newPage();
await page.goto('https://example.com');
const content = await page.textContent('body');
await fs.promises.writeFile('example.txt', content);
await browser.close();
})();
```
2. 获取页面上的数据并将其存储在远程数据库中
```javascript
const { chromium } = require('playwright');
const { MongoClient } = require('mongodb');
(async () => {
const browser = await chromium.launch();
const page = await browser.newPage();
await page.goto('https://example.com');
const data = await page.evaluate(() => {
return {
title: document.querySelector('title').textContent,
description: document.querySelector('meta[name="description"]').getAttribute('content'),
url: location.href,
};
});
const client = new MongoClient('mongodb://localhost:27017');
await client.connect();
const db = client.db('mydb');
const collection = db.collection('mycollection');
await collection.insertOne(data);
await browser.close();
})();
```
以上是一些简单的示例代码,你可以根据自己的需求来进行修改和扩展。需要注意的是,在进行数据存储时,需要遵循相关的法律和规定,以避免违法和不当行为的发生。
阅读全文