正则表达式实用大全

需积分: 9 1 下载量 56 浏览量 更新于2024-11-10 收藏 7KB TXT 举报
"这篇文档汇总了常见的正则表达式,用于匹配中文字符、双字节字符、空白行、HTML标记、首尾空白字符、电子邮件地址、网址URL、合法账号、国内电话号码、腾讯QQ号、中国邮政编码、身份证号码、IP地址以及不同类型的数字。这些正则表达式在字符串处理和表单验证方面非常实用。" 正则表达式是一种强大的文本处理工具,用于在字符串中进行模式匹配和查找、替换等操作。以下是文中列出的一些关键正则表达式及其用途: 1. **匹配中文字符**:`[\u4e00-\u9fa5]` 这个表达式用于匹配所有中文字符,范围从Unicode的4E00到9FA5,涵盖了大部分的汉字。 2. **匹配双字节字符**:`[^\x00-\xff]` 双字节字符包括汉字和其他多字节字符,这个表达式可以用来计算包含双字节字符的字符串长度,其中每个双字节字符计为2,ASCII字符计为1。 3. **匹配空白行**:`\n\s*\r` 这个正则表达式可以用来匹配并删除文本中的空白行,包括行尾可能存在的空格。 4. **匹配HTML标记**:`<(\S*?)[^>]*>.*?</\1>|<.*? />` 虽然这个表达式能匹配一些简单的HTML标签,但它无法处理复杂的嵌套标签,适用于基础的HTML清理。 5. **匹配首尾空白字符**:`^\s*|\s*$` 这个表达式可以用来删除字符串开头或结尾的任何空白字符,包括空格、制表符和换页符。 6. **匹配Email地址**:`\w+([-+._]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` 这个正则表达式常用于表单验证,以确保输入的邮箱地址格式正确。 7. **匹配网址URL**:`[a-zA-z]+://[^\s]*` 这个正则表达式可以匹配标准格式的URL,但可能无法处理某些复杂或非标准的URL结构。 8. **匹配合法账号**:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` 该正则表达式用于验证账号是否以字母开头,且长度在5-16字符之间,允许字母、数字和下划线。 9. **匹配国内电话号码**:`\d{3}-\d{8}|\d{4}-\d{7}` 这个表达式可以识别中国地区的电话号码,支持区号+号码或直拨号码两种形式。 10. **匹配腾讯QQ号**:`[1-9][0-9]{4,}` 腾讯QQ号从10000开始,所以这个正则可以匹配所有有效的QQ号码。 11. **匹配中国邮政编码**:`[1-9]\d{5}(?!\d)` 中国邮政编码是6位数字,这个正则确保匹配的数字符合这一规则。 12. **匹配身份证号码**:`\d{15}|\d{18}` 中国身份证号码可能是15位或18位,这个正则可以匹配这两种格式。 13. **匹配IP地址**:`\d+\.\d+\.\d+\.\d+` 这个正则表达式可以识别IPv4地址。 14. **匹配特定数字**: - `^[1-9]\d*$` 匹配正整数 - `^-[1-9]\d*$` 匹配负整数 - `^-?[1-9]\d*$` 匹配整数 - `^[1-9]\d*|0$` 匹配非负整数 - `^-[1-9]\d*|0$` 匹配非正整数 - `^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$` 匹配正浮点数 这些正则表达式在编程和数据处理中非常实用,可以帮助开发者快速准确地处理和验证各种文本数据。