怎么使用re.findall()实现中文分句,每个分句结尾保留分隔符
时间: 2023-04-08 20:01:21 浏览: 146
extract-eng-sentence.rar_site:www.pudn.com_英文自动分句
可以使用正则表达式来实现中文分句,具体代码如下:
import re
text = "这是第一句。这是第二句。这是第三句。"
pattern = r'[^。!?]+[。!?]'
sentences = re.findall(pattern, text)
print(sentences)
输出结果为:
['这是第一句。', '这是第二句。', '这是第三句。']
其中,正则表达式中的[^。!?]表示匹配除了句号、感叹号和问号之外的任意字符,+表示匹配前面的字符一次或多次,[。!?]表示匹配句号、感叹号和问号中的任意一个。这样就可以将中文文本按照句号、感叹号和问号分隔成多个句子了。
阅读全文