全面解析:正则表达式实用大全

需积分: 9 1 下载量 109 浏览量 更新于2024-09-10 收藏 28KB DOC 举报
"常用正则表达式大全" 正则表达式是一种强大的文本处理工具,用于匹配、查找、替换等操作。以下是一些常见的正则表达式及其用途: 1. 匹配中文字符:[u4e00-u9fa5] - 这个正则表达式用于识别和匹配中文字符,范围覆盖了Unicode编码中的所有汉字。 2. 匹配双字节字符:[^x00-xff] - 双字节字符包括中文字符和其他非ASCII字符,这个表达式用来计数非ASCII字符。 3. 匹配空白行:ns*r - 这个正则表达式可以匹配任何包含换行符(n)和/或回车符(r)的行,常用于删除或替换空白行。 4. 匹配HTML标记:<(S*?)[^>]*>.*?|<.*?>/ - 虽然不完全,但这个正则表达式可以帮助找到HTML标签,不过对于复杂的嵌套标签可能不够准确。 5. 匹配首尾空白字符:^s*|s*$ - 用于去除字符串开始或结束的空格、制表符等空白字符。 6. 匹配Email地址:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* - 这个正则表达式用于验证电子邮件地址的格式是否正确。 7. 匹配网址URL:[a-zA-z]+://[^s]* - 可以识别并提取网页链接,但不能处理所有类型的URL,尤其是包含特殊字符或非英文字符的URL。 8. 匹配帐号合法性:^[a-zA-Z][a-zA-Z0-9_]{4,15}$ - 用于检查用户名是否符合指定规则,即以字母开头,包含5-16个字母、数字或下划线。 9. 匹配国内电话号码:d{3}-d{8}|d{4}-d{7} - 能够匹配中国的固定电话和手机号码,如0511-4405222或021-87888822。 10. 匹配腾讯QQ号:[1-9][0-9]{4,} - 验证QQ号是否有效,QQ号通常从10000开始。 11. 匹配中国邮政编码:[1-9]d{5}(?!d) - 用于验证6位数字的中国邮政编码。 12. 匹配身份证:d{15}|d{18} - 识别15位或18位的中国公民身份证号码。 13. 匹配IP地址:d+.d+.d+.d+ - 提取IPv4地址。 14. 匹配特定数字: - 正整数:^[1-9]d*$ - 负整数:^-[1-9]d*$ - 整数:^-?[1-9]d*$ - 非负整数:^[1-9]d*|0$ - 非正整数:^-[1-9]d*|0$ - 正浮点数:^[1-9]d*.d*|0.d*[1-9]d*$ - 负浮点数:^-([1-9]d*.d*|0.d*[1-9]d*)$ - 浮点数:^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ - 非负浮点数:^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ 这些正则表达式是开发人员在处理文本数据时常用的工具,它们在数据验证、文本清理、信息提取等方面发挥着关键作用。在实际应用中,可能需要根据具体需求对这些表达式进行微调,以确保更精确的匹配。