[('D:\\python项目\\分类分级\\test_dir\\1.docx',)]这种结构怎么取出里面的文本信息
时间: 2023-11-12 13:06:27 浏览: 298
可以使用Python中的docx库来读取.docx文件并提取文本信息。具体步骤如下:
- 安装docx库:在命令行中输入pip install python-docx。
- 导入docx库:在Python脚本中使用import docx导入docx库。
- 打开.docx文件:使用docx.Document()函数打开.docx文件。
- 提取文本信息:使用paragraph.text来提取每个段落的文本信息,并将其存储在一个列表中。
- 关闭.docx文件:使用docx.Document().close()函数关闭.docx文件。
下面是一个示例代码,可以读取给定路径下的.docx文件并提取文本信息:
import docx
def read_docx_file(file_path):
doc = docx.Document(file_path)
text_list = []
for paragraph in doc.paragraphs:
text_list.append(paragraph.text)
doc.close()
return text_list
file_path = 'D:\\python项目\\分类分级\\test_dir\\1.docx'
text_list = read_docx_file(file_path)
print(text_list)