Linux下提取doc插入的文档和文档名
时间: 2023-08-24 11:05:06 浏览: 172
Linux系统中利用node.js提取Word(doc/docx)及PDF文本的内容
在Linux下,可以使用unzip命令来提取doc文件中插入的文档和文档名。具体步骤如下:
1. 首先安装unzip命令,如果已经安装可以跳过此步骤。
```bash
sudo apt-get install unzip
```
2. 解压doc文件
```bash
unzip your_doc_file.doc
```
3. 查看解压后的文件列表
```bash
ls
```
4. 在解压后的文件列表中,可以看到插入的文档和文档名。可以使用cat命令查看文档内容,例如:
```bash
cat word/embeddings/word/document.xml
```
其中,word/embeddings/word/document.xml就是插入的文档名,可以根据实际情况进行替换。
阅读全文