实用正则表达式大全:中文匹配与常用验证规则
需积分: 0 159 浏览量
更新于2024-09-11
收藏 22KB DOC 举报
正则表达式是一种强大的文本处理工具,在IT行业中广泛应用,用于数据验证、搜索替换、文本分析等多个场景。以下是一些常用的正则表达式及其应用场景:
1. 匹配中文字符的正则表达式:`[u4e00-u9fa5]`
这个表达式用于匹配Unicode范围内的中文字符,解决了中文字符在正则匹配中的问题。
2. 匹配双字节字符:`[^x00-xff]`
双字节字符包括汉字和其他非ASCII字符,这个表达式可以用于计算字符串的长度,因为每个双字节字符占用两个字节。
3. 空白行匹配:`ns*r`
这个模式用于删除文本中的空白行,`n`代表换行符,`s`代表空白字符(空格、制表符等),`*r`表示零个或多个重复。
4. HTML标记匹配:`<(S*?)[^>]*>.*?|<.*?/>`
这个复杂的正则表达式可以识别HTML标记,但并不完全适用于所有嵌套情况,只能处理部分结构。
5. 邮件地址匹配:`w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*`
在表单验证时,这个正则表达式用于检查电子邮件地址的格式是否正确。
6. URL匹配:`[a-zA-z]+://[^s]*`
提供了一个更全面的URL匹配模式,可以捕捉大部分常见的URL格式。
7. 帐号验证:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$`
用于检查账户名是否符合特定格式,如字母开头、长度限制等。
8. 国内电话号码匹配:`d{3}-d{8}|d{4}-d{7}`
这个模式用于匹配常见的中国电话号码格式,如区号加号码。
9. 腾讯QQ号匹配:`[1-9][0-9]{4,}`
QQ号从10000开始,这个正则表达式用于验证QQ号码的有效性。
10. 中国邮政编码:`[1-9]d{5}(?!d)`
中国邮政编码是6位数字,此正则确保只包含6位且没有多余数字。
11. 身份证号匹配:`d{15}|d{18}`
匹配15位或18位的中国大陆身份证号码。
12. IP地址匹配:`d+.d+.d+.d+`
此模式用于提取IP地址,适合网络相关的数据处理。
13. 数字匹配:
- 匹配正整数:`^[1-9]d*$`
- 匹配负整数:`^-[1-9]d*$`
- 匹配整数:`^-?[1-9]d*$`
- 匹配非负整数:`^[1-9]d*|0$`
- 匹配非正整数:`^-[1-9]d*|0$`
- 匹配正浮点数:`^[1-9]d*.d*|0.d*[1-9]d*`
- 匹配负浮点数:`^-([1-9]d*.d*|0.d*[1-9]d*)$`
- 匹配浮点数:`^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$`
- 匹配非负浮点数:`^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$`
这些正则表达式提供了处理文本数据时的通用工具,但在实际应用中,可能需要根据具体需求进行适当的调整和优化。
2018-05-22 上传
2017-10-18 上传
2019-09-29 上传
2024-12-28 上传
2024-12-28 上传