在Java中我有一个配置文件是中文的标点符号,然后我读取完配置文件拿到了这些标点符号,我该如何用正则把这些中文符号分隔开存进集合
时间: 2024-02-23 14:59:41 浏览: 86
Java读取properties配置文件时,出现中文乱码的解决方法
你可以使用 Java 中的正则表达式和集合来实现这个需求。下面是示例代码:
```java
String config = "配置文件的内容,包含中文标点符号。";
Pattern pattern = Pattern.compile("[,。?!;:“”‘’【】《》]");
String[] words = pattern.split(config);
List<String> wordList = new ArrayList<>();
for (String word : words) {
if (!word.trim().isEmpty()) {
wordList.add(word.trim());
}
}
System.out.println(wordList);
```
在上面的代码中,我们首先使用正则表达式将中文标点符号作为分隔符,将配置文件内容分割成字符串数组 words。然后我们创建一个空的字符串集合 wordList,遍历 words 数组,将不为空的词语添加到 wordList 集合中。
最后输出 wordList 集合内容,即为分割后的词语集合。
希望对你有所帮助!
阅读全文