常用正则表达式大全

需积分: 9 1 下载量 80 浏览量 更新于2024-09-20 收藏 34KB DOC 举报
"LL常用的正则表达式.doc包含了一些常用且实用的正则表达式,主要应用于文本处理、数据验证和格式检查等场景。" 正则表达式是一种强大的文本匹配工具,广泛用于验证输入数据、搜索和替换文本、数据提取等任务。在IT行业中,特别是在编程、Web开发和数据分析中,熟练掌握正则表达式是非常重要的技能。 1. **匹配中文字符**:`\[u4e00-u9fa5\]` 这个正则表达式用于匹配Unicode范围内的中文字符,覆盖了所有常见的汉字。这对于处理中文文本或进行中文输入验证非常有用。 2. **匹配双字节字符**:`[^x00-xff]` 双字节字符通常包括非ASCII编码的字符,例如中文、日文、韩文等。这个表达式可以用来计算字符串中非ASCII字符的数量。 3. **匹配空白行**:`ns*r` 使用此正则表达式可以找到并删除文本中的空白行,适用于清理文本文件或代码。 4. **匹配HTML标记**:`<(S*?)[^>]*>.*?|<.*?/>` 虽然这个正则表达式可以匹配部分HTML标签,但处理复杂嵌套的HTML结构可能不够全面,通常建议使用HTML解析库来处理HTML内容。 5. **匹配首尾空白字符**:`^s*|s*$` 用于删除行首行尾的空白字符,如空格、制表符等,常用于格式化文本。 6. **匹配Email地址**:`w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*` 此正则表达式可以用来验证电子邮件地址的格式,但请注意,电子邮件地址的复杂性可能超出此表达式的匹配范围,更严格的验证可能需要使用更复杂的正则表达式或邮件地址验证库。 7. **匹配网址URL**:`[a-zA-z]+://[^s]*` 这个表达式可以匹配大部分基本的URL,但不适用于所有情况,如带有特殊字符的URL。 8. **匹配帐号合法性**:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` 用于验证以字母开头,长度在5-16字节之间的用户名,允许字母、数字和下划线,是常见的表单验证规则。 9. **匹配国内电话号码**:`d{3}-d{8}|d{4}-d{7}` 可以匹配中国大陆地区的电话号码,包括区号与电话号码。 10. **匹配腾讯QQ号**:`[1-9][0-9]{4,}` 验证腾讯QQ号码,起始于10000的五位或更多位数字序列。 11. **匹配中国邮政编码**:`[1-9]d{5}(?!d)` 匹配中国六位数的邮政编码。 12. **匹配身份证号**:`d{15}|d{18}` 识别15位或18位的中国身份证号码。 13. **匹配IP地址**:`d+.d+.d+.d+` 用于提取IPv4地址。 14. **匹配特定数字**: - `^[1-9]d*$` 匹配正整数。 - `^-[1-9]d*$` 匹配负整数。 - `^-?[1-9]d*$` 匹配整数。 - `^[1-9]d*|0$` 匹配非负整数。 - `^-?[1-9]d*|0$` 匹配非正整数。 - `^[1-9]d*.d*|0.d*[1-9]d*$` 匹配正浮点数。 - `^-([1-9]d*.d*|0.d*[1-9]d*)$` 匹配负浮点数。 - `^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$` 匹配浮点数。 掌握这些常用的正则表达式能够极大地提高你在处理文本数据时的效率和准确性,它们是IT专业人士的必备工具。不过,需要注意的是,正则表达式并非万能,对于复杂的数据处理,可能需要结合编程语言提供的更强大功能或者专门的库来实现。