java提取字符串中的汉字
时间: 2023-05-19 15:02:20 浏览: 71
可以使用正则表达式来提取字符串中的汉字,示例代码如下:
```java
String str = "Hello 你好!";
Pattern pattern = Pattern.compile("[\\u4e00-\\u9fa5]+");
Matcher matcher = pattern.matcher(str);
while (matcher.find()) {
System.out.println(matcher.group());
}
```
这段代码会输出字符串中的汉字:"你好"。
相关问题
用Java提取字符串中的所有中文
可以使用正则表达式来提取字符串中的所有中文。以下是一个Java代码示例:
```java
String str = "Hello, 你好,世界!";
Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]+");
Matcher matcher = pattern.matcher(str);
while (matcher.find()) {
System.out.println(matcher.group());
}
```
解释一下代码:
- 首先定义一个包含中文的字符串 `str`。
- 接着使用正则表达式 `[\u4e00-\u9fa5]+`,其中 `\u4e00` 到 `\u9fa5` 是 Unicode 中所有中文字符的范围,`+` 表示匹配多个中文字符。
- 然后使用 `Pattern` 类的 `compile` 方法将正则表达式编译成一个模式。
- 再使用 `Matcher` 类的 `matcher` 方法将模式应用到字符串上。
- 最后使用 `find` 方法和 `group` 方法遍历所有匹配的中文字符,并将其打印出来。
java提取字符串中的汉字和特殊字符忽略数字
### 回答1:
可以使用正则表达式来实现。
代码示例:
```
String str = "Hello, 世界! 123";
String chinese = str.replaceAll("[^\u4e00-\u9fa5]", ""); // 提取中文汉字
String special = str.replaceAll("[a-zA-Z0-9\u4e00-\u9fa5\\s]", ""); // 提取特殊字符,忽略数字
```
上面的代码中,chinese变量中存储的是提取出来的中文汉字,special变量中存储的是提取出来的特殊字符。
另外,"[^\u4e00-\u9fa5]" 正则表达式表示的是所有不在这个范围内的字符, "[a-zA-Z0-9\u4e00-\u9fa5\\s]" 正则表达式表示的是所有在这个范围内的字符
### 回答2:
要提取字符串中的汉字和特殊字符,而忽略数字,可以使用Java中的正则表达式。
首先,我们可以使用正则表达式"[\u4e00-\u9fa5\\p{P}]",其中"\u4e00-\u9fa5"代表汉字的Unicode编码范围,"\\p{P}"代表所有的标点符号和特殊字符。这个正则表达式可以用来匹配汉字和特殊字符。
我们可以通过以下步骤来实现提取汉字和特殊字符:
1. 创建一个Pattern对象,使用上述正则表达式作为参数。
2. 创建一个Matcher对象,使用要提取的字符串作为参数,并调用matcher()方法。
3. 使用find()方法来查找下一个匹配项。
4. 如果找到了匹配项,可以通过调用group()方法来获取匹配到的字符串。
5. 判断字符串是否为数字,如果不是数字,则将其保存到一个结果字符串中。
6. 重复步骤3到5,直到找不到匹配项为止。
以下是一个示例代码:
```java
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main(String[] args) {
String str = "abc123汉字,!@#";
String result = "";
Pattern pattern = Pattern.compile("[\u4e00-\u9fa5\\p{P}]");
Matcher matcher = pattern.matcher(str);
while (matcher.find()) {
String match = matcher.group();
if (!match.matches("\\d+")) {
result += match;
}
}
System.out.println(result);
}
}
```
在上述示例中,输入的字符串是"abc123汉字,!@#",输出结果是"汉字,!@#",其中数字"123"被忽略掉了。
### 回答3:
在Java中提取字符串中的汉字和特殊字符并忽略数字,可以使用正则表达式进行匹配。以下是一种实现方法:
首先,使用正则表达式`[^\u4E00-\u9FA5a-zA-Z0-9]`匹配字符串中的非汉字、非字母、非数字的特殊字符。其中,`\u4E00-\u9FA5`表示汉字的Unicode范围。通过使用`[^...]`来匹配除括号内字符之外的任意字符。
接着,使用`replaceAll()`方法将匹配到的特殊字符替换为空格,从而实现忽略这些特殊字符。
最后,使用正则表达式`[^\\p{P}\u4E00-\u9FA5]+`匹配除了汉字和标点符号之外的任意字符,再次使用`replaceAll()`将这些字符替换为空格。
下面是具体的实现代码:
```java
public class Main {
public static void main(String[] args) {
String str = "abc你好123!@#$%哈哈123";
String regex = "[^\\u4E00-\\u9FA5a-zA-Z0-9]";
String result = str.replaceAll(regex, "");
regex = "[^\\p{P}\\u4E00-\\u9FA5]+";
result = result.replaceAll(regex, "");
System.out.println(result);
}
}
```
运行上述代码,输出结果为`abc你好哈哈`。即成功提取字符串中的汉字和特殊字符,忽略了数字。