实用正则表达式大全:中文匹配与常用验证规则

需积分: 0 0 下载量 159 浏览量 更新于2024-09-11 收藏 22KB DOC 举报
正则表达式是一种强大的文本处理工具,在IT行业中广泛应用,用于数据验证、搜索替换、文本分析等多个场景。以下是一些常用的正则表达式及其应用场景: 1. 匹配中文字符的正则表达式:`[u4e00-u9fa5]` 这个表达式用于匹配Unicode范围内的中文字符,解决了中文字符在正则匹配中的问题。 2. 匹配双字节字符:`[^x00-xff]` 双字节字符包括汉字和其他非ASCII字符,这个表达式可以用于计算字符串的长度,因为每个双字节字符占用两个字节。 3. 空白行匹配:`ns*r` 这个模式用于删除文本中的空白行,`n`代表换行符,`s`代表空白字符(空格、制表符等),`*r`表示零个或多个重复。 4. HTML标记匹配:`<(S*?)[^>]*>.*?|<.*?/>` 这个复杂的正则表达式可以识别HTML标记,但并不完全适用于所有嵌套情况,只能处理部分结构。 5. 邮件地址匹配:`w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*` 在表单验证时,这个正则表达式用于检查电子邮件地址的格式是否正确。 6. URL匹配:`[a-zA-z]+://[^s]*` 提供了一个更全面的URL匹配模式,可以捕捉大部分常见的URL格式。 7. 帐号验证:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` 用于检查账户名是否符合特定格式,如字母开头、长度限制等。 8. 国内电话号码匹配:`d{3}-d{8}|d{4}-d{7}` 这个模式用于匹配常见的中国电话号码格式,如区号加号码。 9. 腾讯QQ号匹配:`[1-9][0-9]{4,}` QQ号从10000开始,这个正则表达式用于验证QQ号码的有效性。 10. 中国邮政编码:`[1-9]d{5}(?!d)` 中国邮政编码是6位数字,此正则确保只包含6位且没有多余数字。 11. 身份证号匹配:`d{15}|d{18}` 匹配15位或18位的中国大陆身份证号码。 12. IP地址匹配:`d+.d+.d+.d+` 此模式用于提取IP地址,适合网络相关的数据处理。 13. 数字匹配: - 匹配正整数:`^[1-9]d*$` - 匹配负整数:`^-[1-9]d*$` - 匹配整数:`^-?[1-9]d*$` - 匹配非负整数:`^[1-9]d*|0$` - 匹配非正整数:`^-[1-9]d*|0$` - 匹配正浮点数:`^[1-9]d*.d*|0.d*[1-9]d*` - 匹配负浮点数:`^-([1-9]d*.d*|0.d*[1-9]d*)$` - 匹配浮点数:`^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$` - 匹配非负浮点数:`^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$` 这些正则表达式提供了处理文本数据时的通用工具,但在实际应用中,可能需要根据具体需求进行适当的调整和优化。