正则表达式全集:匹配与验证各类格式

需积分: 9 3 下载量 126 浏览量 更新于2024-09-15 1 收藏 37KB DOC 举报
"正则表达式大全" 正则表达式是一种强大的文本处理工具,常用于数据提取、验证输入、文本搜索和替换等任务。以下是一些常见的正则表达式及其应用场景: 1. 匹配HTML标记的正则表达式:`<(S*?)[^>]*>.*?|<.*?/>` 这个表达式用于查找HTML文档中的开始和结束标签。然而,由于HTML的嵌套特性,它可能无法匹配所有复杂的结构,特别是对于嵌套的标签。 2. 匹配首尾空白字符的正则表达式:`^s*|s*$` 这个表达式可以用来删除字符串行首行尾的空白字符,如空格、制表符和换页符,对于清理文本非常有用。 3. 匹配Email地址的正则表达式:`w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*` 这个正则表达式用于验证电子邮件地址的格式,但请注意,它可能无法涵盖所有的有效电子邮件格式,因为电子邮件地址的规则相当复杂。 4. 匹配网址URL的正则表达式:`[a-zA-z]+://[^s]*` 这个表达式可以匹配大部分的URL,但可能无法处理包含特殊字符或某些复杂结构的URL。 5. 匹配中文字符的正则表达式:`[u4e00-u9fa5]` 这个正则表达式用于识别中文字符,范围是Unicode编码中的汉字区间。 6. 匹配双字节字符(包括汉字):`[^x00-xff]` 双字节字符通常包括非ASCII编码的字符,如汉字。这个表达式可以用来计算非ASCII字符的长度。 7. 匹配空白行的正则表达式:`ns*r` 这个正则表达式可以匹配并移除文本中的空白行。 8. 匹配国内电话号码:`d{3}-d{8}|d{4}-d{7}` 这个表达式用于匹配中国大陆地区的电话号码,格式如0511-4405222或021-87888822。 9. 匹配腾讯QQ号:`[1-9][0-9]{4,}` 腾讯QQ号的正则表达式,用于识别有效的QQ号码,最小为5位,最大为16位。 10. 匹配中国邮政编码:`[1-9]d{5}(?!d)` 用于识别中国6位数字的邮政编码。 11. 匹配身份证号码:`d{15}|d{18}` 中国的身份证号码可能是15位或18位,这个正则表达式可以匹配这两种情况。 12. 匹配IP地址:`d+.d+.d+.d+` IP地址的正则表达式,用于提取或验证IP地址。 13. 数字匹配正则表达式: - `^[1-9]d*$` 匹配正整数 - `^-[1-9]d*$` 匹配负整数 - `^-?[1-9]d*$` 匹配整数 - `^[1-9]d*|0$` 匹配非负整数(正整数+0) - `^-[1-9]d*|0$` 匹配非正整数(负整数+0) - `^[1-9]d*.d*|0.d*[1-9]d*$` 匹配正浮点数 - `^-([1-9]d*.d*|0.d*[1-9]d*)$` 匹配负浮点数 - `^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$` 匹配浮点数 - `^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$` 匹配非负浮点数(正浮点数+0) - `^(-([1-9]d*` 以上是正则表达式的部分实例,它们在各种场景下都有其独特的应用价值。熟练掌握正则表达式,可以帮助我们更高效地处理文本数据。