Python从word文档中另存出图片
时间: 2024-10-16 22:21:06 浏览: 48
python读取word文档的方法
5星 · 资源好评率100%
在Python中,我们可以利用第三方库如`python-docx`处理Word文档,而`PIL`(Pillow)则用于处理图像。如果你想要从Word文档中提取图片并另存为其他格式,可以按照以下步骤操作:
首先,你需要安装这两个库,如果尚未安装,可以使用pip命令:
```bash
pip install python-docx pillow
```
然后,你可以编写如下代码示例:
```python
from docx import Document
from PIL import Image
def extract_images_from_word(filename):
doc = Document(filename)
for paragraph in doc.paragraphs:
if paragraph.has_image:
image_part = paragraph._element.xpath('./w:pPr/w:drawing')[0]
img_data = image_part.get_or_add_blob().decode('binary')
# 创建Image对象并保存到指定位置
with Image.open(io.BytesIO(img_data)) as img:
new_filename = f"{paragraph.image_media_id}.jpg" # 或者你想保存的其他格式
img.save(new_filename)
# 使用函数
extract_images_from_word("your_word_document.docx")
```
这个脚本会遍历Word文档中的每个段落,检查是否有图片,如果有,则获取图片数据,并将其另存为.jpg格式。记得将`"your_word_document.docx"`替换为你实际的Word文档路径。
阅读全文