Java正则表达式:过滤与清除特殊字符的方法

5星 · 超过95%的资源 需积分: 50 112 下载量 66 浏览量 更新于2024-09-13 收藏 61KB DOC 举报
"Java正则表达式用于过滤特殊字符的方法" 在Java编程中,正则表达式是一个强大的工具,常用于字符串的匹配、查找、替换等操作。在处理用户输入或者文本数据时,我们可能需要过滤掉一些特殊字符,以确保数据的规范性和安全性。本文将详细介绍如何使用Java正则表达式来过滤特殊字符。 首先,我们需要了解正则表达式的基本语法。正则表达式是由特殊字符和普通字符组成的字符串,用于定义文本模式。在Java中,我们可以使用`java.util.regex`包中的`Pattern`和`Matcher`类来处理正则表达式。 在提供的代码示例中,有一个名为`StringFilter`的静态方法,它接受一个字符串参数`str`,并使用正则表达式来清除所有特殊字符。这个正则表达式的定义是`regEx="[`~!@#$%^&*()+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?]"`。这个正则表达式包含了大部分常见的特殊字符,例如标点符号、键盘上的特殊键以及中文的特殊字符。 正则表达式的工作原理是通过`Pattern.compile(regEx)`编译成一个模式对象,然后使用`matcher(str)`创建一个匹配器,这个匹配器可以对输入字符串进行匹配和替换操作。`m.replaceAll("")`将所有匹配到的特殊字符替换为空字符串,`trim()`则是去除字符串首尾的空白字符。 在测试方法`testStringFilter`中,创建了一个包含特殊字符的字符串,并调用了`StringFilter`方法,打印出原始字符串和过滤后的字符串,展示了过滤特殊字符的功能。 正则表达式的关键符号有以下含义: - `\d`:匹配任何数字,等同于`[0-9]` - `\D`:匹配任何非数字字符,等同于`[^0-9]` - `\s`:匹配任何空白字符,包括空格、制表符、换页符等,等同于`[\t\n\x0B\f\r]` - `\S`:匹配任何非空白字符,等同于`[^\t\n\x0B\f\r]` - `\w`:匹配任何单词字符,包括字母、数字和下划线,等同于`[a-zA-Z_0-9]` - `\W`:匹配任何非单词字符,等同于`[^a-zA-Z_0-9]` 此外,还有一些其他特殊符号,如`\b`表示单词边界,`\B`表示非单词边界,`\G`表示前一个匹配的结束,`^`和`$`分别表示字符串的开始和结束,`.`可以匹配任意单个字符,但不包括换行符。 在实际应用中,可以根据需求调整正则表达式,添加或删除需要过滤的特殊字符。正则表达式的强大之处在于它的灵活性和可扩展性,可以处理复杂的文本匹配任务。然而,由于其语法复杂,需要花费时间去学习和熟练掌握。 总结,Java正则表达式提供了过滤特殊字符的强大功能,通过`Pattern`和`Matcher`类,可以高效地实现字符串的清洗。在处理用户输入或文本数据时,这是一项非常实用的技术。对于初学者来说,理解并掌握正则表达式的基本语法和常用符号,是提升编程能力的重要一步。
2011-06-26 上传
[正则表达式]文本框输入内容控制 ….. 默认分类 2009-02-13 10:10 阅读26 评论0 字号: 大大 中中 小小整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$只能输入数字:"^[0-9]*$"。只能输入n位的数字:"^\d{n}$"。只能输入至少n位的数字:"^\d{n,}$"。只能输入m~n位的数字:。"^\d{m,n}$"只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?$"。只能输入非零的正整数:"^\+?[1-9][0-9]*$"。只能输入非零的负整数:"^\-[1-9][]0-9"*$。只能输入长度为3的字符:"^.{3}$"。只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。只能输入由数字和26个英文字母组成的字符串:"^[A-Za-z0-9]+$"。只能输入由数字、26个英文字母或者下划线组成的字符串:"^\w+$"。验证用户密码:"^[a-zA-Z]\w{5,17}$"正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。验证是否含有^%&',;=?$\"等字符:"[^%&',;=?$\x22]+"。只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"验证Email地址:"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"。验证InternetURL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。验证电话号码:"^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为:"XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。验证身份证号(15位或18位数字):"^\d{15}|\d{18}$"。验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"1"~"12"。验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"和"1"~"31"。匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)String.prototype.len=function(){return this.replace(/[^\x00-\xff]/g,"aa").length;} 匹配空行的正则表达式:\n[\s| ]*\r 匹配html标签的正则表达式:<(.*)>(.*)<\/(.*)>|<(.*)\/> 匹配首尾空格的正则表达式:(^\s*)|(\s*$) 应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下: String.prototype.trim = function(){return this.replace(/(^\s*)|(\s*$)/g, "");} 利用正则表达式分解和转换IP地址: 下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序: function IP2V(ip){re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式if(re.test(ip)){return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1}else{throw new Error("Not a valid IP address!")}} 不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下: var ip="10.100.20.168"ip=ip.split(".")alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1)) 匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? 利用正则表达式限制网页表单里的文本框输入内容: 用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" 用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))" 用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" <input onkeyup="value=value.replace(/[^\u4E00-\u9FA5\w]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5\w]/g,''))" value="允许下划线,数字字母和汉字"> <script language="javascript">if (document.layers)//触发键盘事件document.captureEvents(Event.KEYPRESS) function xz(thsv,nob){if(nob=="2"){window.clipboardData.setData("text","")alert("避免非法字符输入,请勿复制字符");return false;}if (event.keyCode!=8 && event.keyCode!=16 && event.keyCode!=37 && event.keyCode!=38 && event.keyCode!=39 && event.keyCode!=40){thsvv=thsv.value;//输入的值thsvs=thsvv.substring(thsvv.length-1);//输入的最后一个字符//thsvss=thsvv.substring(0,thsvv.length-1);//去掉最后一个错误字符if (!thsvs.replace(/[^\u4E00-\u9FA5\w]/g,'') || event.keyCode==189){//正则除去符号和下划线 keythsv.value='请勿输入非法符号 ['+thsvs+']';alert('请勿输入非法符号 ['+thsvs+']');thsv.value="";return false;}}} </script> <input onkeyup="xz(this,1)" onPaste="xz(this,2)" value="">允许数字字母和汉字 <script language="javascript">