怎么使用re.findall()实现中文分句,每个分句结尾保留分隔符,其中分隔符包括。?!:;
时间: 2023-04-08 12:01:22 浏览: 116
extract-eng-sentence.rar_site:www.pudn.com_英文自动分句
可以使用正则表达式来实现中文分句,具体代码如下:
import re
text = "这是一个中文句子。这是另一个中文句子!这是第三个中文句子:这是第四个中文句子;"
pattern = r'[。!?:;]'
sentences = re.split(pattern, text)
for i in range(len(sentences)):
if i < len(sentences) - 1:
sentences[i] += re.findall(pattern, text)[i]
print(sentences)
输出结果为:
['这是一个中文句子。', '这是另一个中文句子!', '这是第三个中文句子:', '这是第四个中文句子;']
阅读全文