from docx import Document def extract_images_from_docx(docx_path, output_folder): doc = Document(docx_path) for rel in doc.part.rels.values(): if "image" in rel.reltype: image_part = rel.target_part image_data = image_part.blob # 生成图像文件名 image_filename = f"{output_folder}/{rel.rId}.{image_part.ext}" # 将图像数据保存为文件 with open(image_filename, "wb") as f: f.write(image_data) print("提取图片:", image_filename) # 指定 Word 文档路径和输出文件夹 docx_path = "example.docx" output_folder = "images" # 调用函数提取图片 extract_images_from_docx(docx_path, output_folder)
时间: 2024-04-19 18:30:31 浏览: 305
DOS命令说明.docx
你的代码看起来很好!它使用了`python-docx`库来提取Word文档中的图像,并保存到指定的输出文件夹中。代码中的`extract_images_from_docx`函数接受两个参数:`docx_path`是指定的Word文档路径,`output_folder`是指定的输出文件夹路径。
在函数内部,它打开Word文档并遍历所有的关系(rels)。如果关系的类型包含"image",则表示该关系是与图像相关的。然后,它获取图像部分(target_part)并获取图像数据(blob)。接下来,它生成图像文件名,并将图像数据保存为文件。
你只需要将`example.docx`替换为你要提取图像的Word文档路径,将`images`替换为你要保存图像的输出文件夹路径。然后调用`extract_images_from_docx`函数即可提取图像。
希望这对你有所帮助!如果你还有其他问题,请随时提问。
阅读全文