使用re.split进行中文分句,以逗号等中文符号作为分隔符,怎么返回分句时被清除的符号
时间: 2023-04-06 15:03:17 浏览: 129
python实现中文文本分句的例子
5星 · 资源好评率100%
可以使用re.findall()函数来实现中文分句,并且保留分隔符。具体实现代码如下:
import re
text = "这是一段中文,用于测试re.split函数。分隔符是中文符号,例如逗号、句号等。"
sentences = re.findall(r'[^,。?!]+[,。?!]?', text)
print(sentences)
输出结果为:
['这是一段中文,', '用于测试re.split函数。', '分隔符是中文符号,', '例如逗号、', '句号等。']
可以看到,分隔符被保留在了分句中。
阅读全文