使用re.split进行中文分句,以逗号等中文符号作为分隔符,怎么返回分句时被清除的符号
时间: 2023-04-06 10:03:17 浏览: 156
可以使用re.findall()函数来实现中文分句,并且保留分隔符。具体实现代码如下:
import re
text = "这是一段中文,用于测试re.split函数。分隔符是中文符号,例如逗号、句号等。"
sentences = re.findall(r'[^,。?!]+[,。?!]?', text)
print(sentences)
输出结果为:
['这是一段中文,', '用于测试re.split函数。', '分隔符是中文符号,', '例如逗号、', '句号等。']
可以看到,分隔符被保留在了分句中。
相关问题
怎么使用re.findall()实现中文分句,每个分句结尾保留分隔符,且分隔符包括所有中文符号
可以使用正则表达式来实现中文分句,代码如下:
import re
text = "这是一段中文文本,包含多个句子。每个句子都以中文符号结尾,比如句号、问号、感叹号等。"
pattern = r'[。?!;]'
sentences = re.split(pattern, text)
for i in range(len(sentences)):
if i < len(sentences) - 1:
sentences[i] += re.findall(pattern, text)[i]
print(sentences)
输出结果为:
['这是一段中文文本,包含多个句子。', '每个句子都以中文符号结尾,比如句号、问号、感叹号等。']
怎么使用re.findall()实现中文分句,每个分句结尾保留分隔符,其中分隔符包括。?!:;
可以使用正则表达式来实现中文分句,具体代码如下:
import re
text = "这是一个中文句子。这是另一个中文句子!这是第三个中文句子:最后一个中文句子;"
pattern = r'[^。!?;:]+[。!?;:]'
sentences = re.findall(pattern, text)
print(sentences)
输出结果为:
['这是一个中文句子。', '这是另一个中文句子!', '这是第三个中文句子:', '最后一个中文句子;']
其中,正则表达式的含义是匹配除了句号、感叹号、问号、分号、冒号以外的任意字符,然后紧跟着一个句号、感叹号、问号、分号、冒号。这样就可以将中文文本分成多个句子,并保留分隔符。
阅读全文
相关推荐
![-](https://img-home.csdnimg.cn/images/20241231044955.png)
![-](https://img-home.csdnimg.cn/images/20241231044901.png)
![-](https://img-home.csdnimg.cn/images/20241231044930.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)