java用正则表达式和集合提取访问信息里的中文名
时间: 2024-10-21 17:09:36 浏览: 29
在Java中,你可以使用正则表达式配合集合(如ArrayList、Pattern和Matcher)来从字符串中提取访问信息中的中文名字。首先,需要定义一个正则模式来匹配中文字符,因为汉字通常由两个连续的Unicode编码组成。以下是一个简单的例子:
```java
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main(String[] args) {
String text = "访问者:张三 李四 王五";
// 正则表达式模式,匹配中文字符,这里假设每个中文名字都由两个连续的全角汉字表示
Pattern pattern = Pattern.compile("\\u4e00\\u8def\\u4e00\\u8def");
Matcher matcher = pattern.matcher(text);
List<String> names = new ArrayList<>();
while (matcher.find()) {
names.add(matcher.group());
}
System.out.println("提取到的中文名字:");
for (String name : names) {
System.out.println(name);
}
}
}
```
在这个例子中,`"\u4e00\u8def"`代表一个汉字,`\u4e00`是汉字的第一个Unicode值,`\u8def`是第二个。正则表达式`"\u4e00\u8def\u4e00\u8def"`会匹配连续的两个汉字。
阅读全文