原生js获取PDF内容
时间: 2023-11-21 09:06:29 浏览: 31
要原生获取 PDF 内容,您可以使用 XMLHttpRequest 或 Fetch API 从服务器上下载 PDF 文件,然后使用 PDF.js 库解析 PDF 文件并获取内容。
以下是一个使用 XMLHttpRequest 获取 PDF 文件并解析内容的示例:
```javascript
// 创建 XMLHttpRequest 对象
const xhr = new XMLHttpRequest();
const url = 'https://example.com/sample.pdf';
// 下载 PDF 文件
xhr.open('GET', url, true);
xhr.responseType = 'arraybuffer';
xhr.onload = function() {
const data = xhr.response;
// 解析 PDF 文件
pdfjsLib.getDocument(data).then(pdf => {
const maxPages = pdf.numPages;
const pageNum = 1;
pdf.getPage(pageNum).then(page => {
const textContent = page.getTextContent();
textContent.then(text => {
const content = text.items.map(item => item.str).join('');
console.log(content);
});
});
});
};
xhr.send();
```
以上代码使用 XMLHttpRequest 对象从指定 URL 下载 PDF 文件,然后使用 PDF.js 库解析文件并获取第一页的文本内容。请注意,PDF.js 库需要在浏览器中运行,因此您需要将其作为模块导入,并在网页中加载。