怎么使用re.findall()实现中文分句,每个分句结尾保留分隔符,且分隔符包括所有中文符号
时间: 2023-04-08 15:01:21 浏览: 125
python实现中文文本分句的例子
5星 · 资源好评率100%
可以使用正则表达式来实现中文分句,代码如下:
import re
text = "这是一段中文文本,包含多个句子。每个句子都以中文符号结尾,比如句号、问号、感叹号等。"
pattern = r'[。?!;]'
sentences = re.split(pattern, text)
for i in range(len(sentences)):
if i < len(sentences) - 1:
sentences[i] += re.findall(pattern, text)[i]
print(sentences)
输出结果为:
['这是一段中文文本,包含多个句子。', '每个句子都以中文符号结尾,比如句号、问号、感叹号等。']
阅读全文