Windows系统下python实现从Word中读取全部内容包含图片，并放入新的Word中

要实现从Word中读取全部内容包含图片，并放入新的Word中，需要使用Python的docx库和python-docx-image库。下面是一个基本的示例代码： ``` from docx import Document from docx.shared import Inches from docx.enum.text import WD_ALIGN_PARAGRAPH from docx.oxml import OxmlElement from docx.oxml.ns import qn from docx.image.image import Image from docx.image.exceptions import UnrecognizedImageError from docx.text.paragraph import Paragraph def add_picture(paragraph, picture_path): try: paragraph.alignment = WD_ALIGN_PARAGRAPH.CENTER run = paragraph.add_run() element = run._element element.tag = 'w:pict' element.set(qn('xmlns:wp'), 'http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing') element.set(qn('xmlns:r'), 'http://schemas.openxmlformats.org/officeDocument/2006/relationships') img = Image(picture_path) width, height = img.width, img.height inline = element.makeelement(qn('wp:inline')) inline.set(qn('distT'), "0") inline.set(qn('distB'), "0") inline.set(qn('distL'), "0") inline.set(qn('distR'), "0") extent = inline.makeelement(qn('wp:extent')) extent.set(qn('cx'), str(width * 9525)) extent.set(qn('cy'), str(height * 9525)) inline.append(extent) docpr = inline.makeelement(qn('wp:docPr')) docpr.set(qn('id'), "1") docpr.set(qn('name'), "Image") docpr.set(qn('descr'), "Image") inline.append(docpr) graphic = inline.makeelement(qn('a:graphic')) inline.append(graphic) graphic.set(qn('xmlns:a'), 'http://schemas.openxmlformats.org/drawingml/2006/main') graphicwrap = graphic.makeelement(qn('a:graphicData')) graphicwrap.set(qn('uri'), 'http://schemas.openxmlformats.org/drawingml/2006/picture') graphic.append(graphicwrap) pic = graphicwrap.makeelement(qn('pic:pic')) graphicwrap.append(pic) nvpicpr = pic.makeelement(qn('pic:nvPicPr')) pic.append(nvpicpr) cnvpr = nvpicpr.makeelement(qn('pic:cNvPr')) cnvpr.set(qn('id'), "0") cnvpr.set(qn('name'), "Image") cnvpr.set(qn('descr'), "Image") nvpicpr.append(cnvpr) nvpicpr.append(inline.makeelement(qn('pic:cNvPicPr'))) blip = pic.makeelement(qn('pic:blipFill')) pic.append(blip) blip.set(qn('dpi'), "96, 96") blip.set(qn('rotWithShape'), "1") blipfill = blip.makeelement(qn('a:blip')) blip.append(blipfill) blipfill.set(qn('r:embed'), inline.makeelement(qn('a:extLst'))) blipfill.set(qn('cstate'), "print") stretch = blip.makeelement(qn('a:stretch')) blip.append(stretch) fillrect = stretch.makeelement(qn('a:fillRect')) stretch.append(fillrect) run._r.append(element) except UnrecognizedImageError: pass # 读取原始文档 doc = Document('original.docx') # 创建新文档 new_doc = Document() for element in doc.element.body: if isinstance(element, Paragraph): # 复制段落 new_paragraph = new_doc.add_paragraph(element.text, element.style) # 处理段落中的图片 for run in element.runs: if run._element.tag.endswith('}r'): for child in run._element: if child.tag.endswith('}pict'): for pic_child in child: if pic_child.tag.endswith('}blip'): picture_path = doc.part.related_parts[pic_child.attrib['{http://schemas.openxmlformats.org/officeDocument/2006/relationships}embed']].partname[1:] add_picture(new_paragraph, picture_path) new_doc.save('new.docx') ``` 这个示例代码首先读取了原始文档，然后创建一个新的文档。它遍历原始文档中的所有段落，并复制它们到新文档中。在复制段落时，它会处理其中的图片，将它们添加到新文档中。处理图片时，它使用了add_picture函数，该函数会将图片添加到指定的段落中。

Windows系统下python实现从Word中读取全部内容包含图片，并放入新的Word中

相关推荐

python批量word转txt（无视文档损坏/不需要依赖库/1秒300个）

DtR：Word文档（.docx）到renpy脚本文件（.rpy）

Python程序基础：文件操作.pptx

python把文件中所有图片都放到一个word中

python获取文件1.txt 中第3行内容放入docx表格

运用python对excel中某一列进行分词完再进行词频统计最后把结果放入excel

python中csv文件中的某一列如何去停用词和中文分词，将处理后的数据放入一个新的csv文件中

使用python将文件夹下的每个word放在excel表里

把分词结果放入excel中

运用jieba对excel中某一列进行分词完再进行词频统计最后把结果放入excel

如果将抽取过的中文文本放入列表中，将如何对中文单词出现频率排序，不能包括中文标点符号在内

在python中请用jieba完成统计三国演义人物的出场次数

用Python实现一个读文本文件的应用案例(采用readlines()

对去停用词的文档进行词频统计，即统计每个词出现的次数。对词频出现次数较高的词汇放入特征词典中，31个类的特征词都放到一个文档里。

python歌词词云制作

最新推荐

基于SpringMVC+Hibernate+AngularJs前后端分离的选课系统+源码+文档+界面展示（毕业设计&课程设计）

51单片机模拟汽车左右转向灯控制系统的源代码和仿真电路

windows hot key

51CTO学院-《Java编程思想》精讲视频教程(上部).docx

JAVA2课程教学大纲.doc

京瓷TASKalfa系列维修手册：安全与操作指南

管理建模和仿真的文件

【进阶】入侵检测系统简介

轨道障碍物智能识别系统开发

小波变换在视频压缩中的应用