python读取word文档,遍历每一个段落,用tag.endswith方法查看其中有没有图片,有则保存该图片,请给出代码
时间: 2024-06-10 21:03:52 浏览: 165
好的,下面是Python的代码:
```python
import os
import zipfile
from docx import Document
# 打开Word文档并遍历每一个段落
doc_path = "your_word_doc_path.docx"
document = Document(doc_path)
for paragraph in document.paragraphs:
# 如果段落中有图片则保存该图片
for run in paragraph.runs:
if run._r.xml.find("<w:drawing>") != -1:
pic = run._r.find(".//a:blip", namespaces=run._r.nsmap)
if pic is not None:
uri = pic.attrib["{http://schemas.openxmlformats.org/officeDocument/2006/relationships}embed"]
image = document.part.related_parts[uri]
image.save(image.partname[4:], os.path.join(doc_path.split(".")[0], image.partname[4:]))
```
这段代码会通过Document类打开指定路径的Word文档,在遍历每一个段落时查找其中是否有图片,如果有则保存该图片。注意,由于Word中的图片可能是嵌入式的,因此需要访问其相关部件并将其保存在适当的路径下。
阅读全文