首页python读取word文档,遍历每一个段落,用docx中tag.endswith('}drawing')方法查看其中有没有图片,有则保存该图片,请给出代码

python读取word文档,遍历每一个段落,用docx中tag.endswith('}drawing')方法查看其中有没有图片,有则保存该图片,请给出代码

时间: 2024-05-15 09:17:40 浏览: 14

下面是Python代码实现，可以读取Word文档中的每个段落，如果其中含有图片，则将其保存到本地： ``` python import docx import os # 读取Word文档 doc = docx.Document('example.docx') # 遍历每个段落 for para in doc.paragraphs: # 查看段落中是否存在图片 for run in para.runs: # 判断是否存在图片 if run._element.tag.endswith('}drawing'): # 获取图片名称 image_name = run._element.xpath('.//pic:blipFill/a:blip/@r:embed', namespaces=docx.opc.constants.PREFIXES)[0] # 保存图片到本地 with open(image_name, 'wb') as f: f.write(run._element.xpath('.//a:blip/a:extLst/a:ext/@uri', namespaces=docx.opc.constants.PREFIXES)[0]) print(f"保存图片成功: {image_name}") ``` 说明： - `docx.Document()` 函数可以读取Word文档，返回一个 Document 对象。 - `doc.paragraphs` 属性可以获取Word文档中所有的段落，返回一个列表。 - 对于每个段落，我们需要遍历每个 run (即格式相同的文本段落)，判断其中是否含有图片。 - 对于含有图片的段落，我们可以从 `run._element` 属性中获取图片的名称和二进制数据，然后将其保存至本地。 - 注意，保存至本地时需要以二进制模式打开文件。

最新推荐

使用python批量读取word文档并整理关键信息到excel表格的实例

python读取word文档,遍历每一个段落,用docx中tag.endswith('}drawing')方法查看其中有没有图片,有则保存该图片,请给出代码

相关推荐

Python读取Word（.docx）正文信息的方法

Ubuntu下使用python读取doc和docx文档的内容方法

使用python批量读取word文档并整理关键信息到excel表格的实例

python读取word文档,遍历每一个段落,用tag.endswith方法查看其中有没有图片,有则保存该图片,请给出代码

python读取word文档,遍历每一个段落,查看其中有没有图片,如果有保存到硬盘,请给出代码

python读取word文档,遍历每一个段落,查看其中有没有jpeg格式图片,如果有保存到硬盘,请给出代码

python读取word文档,遍历每一个段落,查看其中有没有一个不确定格式的图片,如果有保存到硬盘,请给出代码

python-docx如何遍历word文件中表格的每一个单元格文本内容

在 Python-docx 库中，每个段落对象文本运行列表（docx.text.paragraph.Paragraph.runs）中有哪些成员属性

python-docx遍历word文件中表格的每一个单元格，将单位格内文本内容存为一个二维的数组

python处理word文档 查找文字 加下划线_你能用Pythondocx在同一段落的某一部分加下划线吗？...

python读取word文档,如何识别其中的图片文件,并将图片文件保存到硬盘后,从word文档中删除该图片

使用python代码中的python-docx，求出某行有没有图片

python读取word文档,如何识别其中的图片文件

请编写一段python代码，可以读取一个word文档，将文档中的每句话断开并分行

python-docx读取word里每个表格的内容

python读取doc文件_Ubuntu下使用python读取doc和docx文档的内容方法

用python循环遍历一个文件夹下所有的word文件，并提取其中所有的年月日时间参数存入列表中

Python利用Python-docx库将一个word中所有内容copy到另一个文档最下面

最新推荐

使用python批量读取word文档并整理关键信息到excel表格的实例

python实现生成Word、docx文件的方法分析

用python爬取网页并导出为word文档.docx

python docx 中文字体设置的操作方法

利用python程序生成word和PDF文档的方法

利用迪杰斯特拉算法的全国交通咨询系统设计与实现

管理建模和仿真的文件

【实战演练】基于TensorFlow的卷积神经网络图像识别项目

CD40110工作原理

全国交通咨询系统C++实现源码解析

python处理word文档查找文字加下划线_你能用Pythondocx在同一段落的某一部分加下划线吗？...