首页原生js获取PDF内容

原生js获取PDF内容

时间: 2023-11-21 09:06:29 浏览: 31

要原生获取 PDF 内容，您可以使用 XMLHttpRequest 或 Fetch API 从服务器上下载 PDF 文件，然后使用 PDF.js 库解析 PDF 文件并获取内容。以下是一个使用 XMLHttpRequest 获取 PDF 文件并解析内容的示例： ```javascript // 创建 XMLHttpRequest 对象 const xhr = new XMLHttpRequest(); const url = 'https://example.com/sample.pdf'; // 下载 PDF 文件 xhr.open('GET', url, true); xhr.responseType = 'arraybuffer'; xhr.onload = function() { const data = xhr.response; // 解析 PDF 文件 pdfjsLib.getDocument(data).then(pdf => { const maxPages = pdf.numPages; const pageNum = 1; pdf.getPage(pageNum).then(page => { const textContent = page.getTextContent(); textContent.then(text => { const content = text.items.map(item => item.str).join(''); console.log(content); }); }); }); }; xhr.send(); ``` 以上代码使用 XMLHttpRequest 对象从指定 URL 下载 PDF 文件，然后使用 PDF.js 库解析文件并获取第一页的文本内容。请注意，PDF.js 库需要在浏览器中运行，因此您需要将其作为模块导入，并在网页中加载。