首页python 提取txt文本的章节的代码

python 提取txt文本的章节的代码

时间: 2023-02-16 09:13:36 浏览: 397

下面是一个示例代码，用于提取txt文本中的章节： ``` import re # 定义章节标题的正则表达式 pattern = re.compile(r'第[一二三四五六七八九十百千万壹贰叁肆伍陆柒捌玖拾佰仟]{1,6}章') # 读取txt文件内容 with open('book.txt', 'r', encoding='utf-8') as f: content = f.read() # 查找所有匹配的章节标题 for match in pattern.finditer(content): print(match.group()) ``` 这段代码使用正则表达式来查找文本中所有章节标题，并将它们输出到控制台。在这个例子中，章节标题的格式为 "第X章"，其中X表示章节数，可能是中文数字。如果您的文本中的章节格式不同，请修改正则表达式以匹配您的格式。

阅读全文