python 提取txt文本的章节的代码
时间: 2023-02-16 07:13:36 浏览: 374
下面是一个示例代码,用于提取txt文本中的章节:
```
import re
# 定义章节标题的正则表达式
pattern = re.compile(r'第[一二三四五六七八九十百千万壹贰叁肆伍陆柒捌玖拾佰仟]{1,6}章')
# 读取txt文件内容
with open('book.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 查找所有匹配的章节标题
for match in pattern.finditer(content):
print(match.group())
```
这段代码使用正则表达式来查找文本中所有章节标题,并将它们输出到控制台。在这个例子中,章节标题的格式为 "第X章",其中X表示章节数,可能是中文数字。如果您的文本中的章节格式不同,请修改正则表达式以匹配您的格式。
阅读全文