python3批量提取word文档中的图片
时间: 2023-10-02 14:03:25 浏览: 135
可以使用Python中的python-docx库来实现批量提取Word文档中的图片。以下是一个示例代码:
```python
import os
from docx import Document
# 设置Word文档所在目录
docx_dir = "/path/to/docx/files"
# 遍历目录下的所有Word文档
for filename in os.listdir(docx_dir):
if not filename.endswith(".docx"):
continue
# 使用python-docx库打开Word文档
doc = Document(os.path.join(docx_dir, filename))
# 遍历文档中的所有图片
for image in doc.inline_shapes:
# 提取图片数据并保存到文件
with open(image._inline.graphic.graphicData.pic.nvPicPr.cNvPr.name, "wb") as f:
f.write(image._inline.graphic.graphicData.pic.blipFill.blip.blob)
```
该代码将遍历指定目录下的所有Word文档,将其中的图片提取出来并保存到文件中,文件名与原始文件名相同。注意,该方法仅适用于Word文档中嵌入的图片,如果是插入的外部图片则无法提取。此外,Python3 中不支持使用 `_inline.graphicData.pic` 的写法,需要改为 `_inline.graphic.graphicData.pic`。
阅读全文