怎么用python遍历文本文档
时间: 2023-06-10 10:02:55 浏览: 95
你可以使用Python内置的"open"函数打开文本文档,然后使用"for循环"逐行遍历文本内容。
示例代码如下:
```
with open("textfile.txt", "r") as file:
for line in file:
print(line)
```
该代码会打开名为"textfile.txt"的文本文档,并逐行打印出其中的内容。你可以根据你的需求对文本内容进行处理或分析。
相关问题
python遍历Word文档内容
要遍历Word文档内容,可以使用Python中的python-docx包。
以下是一个简单的示例代码,演示了如何使用python-docx包遍历Word文档中的所有段落和表格,并打印它们的文本内容:
```python
import docx
doc = docx.Document('example.docx')
# 遍历文档中的所有段落
for para in doc.paragraphs:
print(para.text)
# 遍历文档中的所有表格
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
```
在此示例中,`example.docx`是要遍历的Word文档的文件名。首先,我们使用`docx.Document()`函数加载文档。然后,我们使用`paragraphs`属性和`tables`属性分别遍历文档中的所有段落和表格。对于每个段落和表格,我们使用`.text`属性获取其文本内容。在表格中,我们使用嵌套的`for`循环遍历每个单元格。
python遍历文件夹下的Word文档内容
下面是一个简单的Python代码示例,用于遍历指定文件夹下的所有Word文档,并读取它们的内容:
```python
import os
import glob
import docx
# 设置要遍历的文件夹路径
folder_path = "C:/Documents"
# 获取该路径下所有扩展名为.docx的文件列表
file_list = glob.glob(folder_path + "/*.docx")
# 循环遍历每个文件,并读取它们的内容
for file_path in file_list:
doc = docx.Document(file_path)
full_text = []
for para in doc.paragraphs:
full_text.append(para.text)
print("".join(full_text))
```
该代码首先使用`glob`模块获取指定文件夹路径下所有扩展名为`.docx`的文件列表。然后,它循环遍历每个文件,并使用`docx`模块读取它们的内容。最后,它将每个段落的文本内容添加到一个列表中,并将它们连接在一起以创建完整的文档文本。
阅读全文