在Java中我有一个配置文件是中文的标点符号,然后我读取完配置文件拿到了这些标点符号,我该如何用正则把这些中文符号分隔开呢?
时间: 2024-02-23 22:58:48 浏览: 103
Java读取properties配置文件时,出现中文乱码的解决方法
你可以使用 Java 的正则表达式来解决这个问题。例如,以下代码可以将包含中文标点符号的字符串分隔开:
```java
String punctuation = ",。!?;:“”‘’()【】《》";
String regex = "[" + punctuation + "]";
String configText = "这是一个包含中文标点符号的字符串,可以用来测试分隔符。";
String[] words = configText.split(regex);
for (String word : words) {
System.out.println(word);
}
```
在这个示例代码中,我们首先定义了一个包含常见中文标点符号的字符串 `punctuation`,然后使用正则表达式的字符类 `[]` 来将这个字符串转换为一个字符集。字符集中的每个字符都表示一个可分隔的标点符号。
接着,我们将字符集作为分隔符的正则表达式 `regex`,使用 `split` 方法将包含中文标点符号的字符串 `configText` 分隔成一个字符串数组 `words`。最后,我们遍历这个数组,输出每个分隔出来的词语。
这个示例代码的输出结果如下:
```
这是一个包含中文标点符号的字符串
可以用来测试分隔符
```
需要注意的是,在这个示例代码中,我们并没有对分隔出来的字符串做任何处理。如果你需要去除空格或者其他特殊字符,需要自己根据需求进行处理。
阅读全文