实用正则表达式大全:匹配各种格式文本

需积分: 9 10 下载量 159 浏览量 更新于2024-09-18 收藏 11KB TXT 举报
这篇文档收集了在工作中常用的正则表达式,涵盖了多个方面,包括中文字符、特殊字符匹配、空白字符处理、HTML标签提取、验证身份证号、邮箱、URL、电话号码、QQ号、身份证号码、IP地址以及各种数值类型的验证等。 1. 中文字符匹配: `[\u4e00-\u9fa5]` 此正则用于匹配任何中文字符,范围是Unicode中的汉字区域。 2. 非ASCII字符去除: `[^\x00-\xff]` 这个正则表达式用来匹配非ASCII字符,常用于清理或过滤非英文字符。 3. 去除行首行尾空白字符: `\n\s*\r` 用于清除字符串开头和结尾的换行符及空格。 4. 提取HTML标签: `<(\S*?)[^>]*>.*?|<.*?/>` 这个正则可以匹配HTML中的标签,包括自闭合标签。 5. 验证身份证号: `^\d{15}|\d{18}` 这个正则可检查15位或18位的身份证号码。 6. 验证邮箱地址: `\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` 用于检查输入是否符合电子邮件地址的格式。 7. 验证URL: `[a-zA-z]+://[^\s]*` 此正则表达式用于验证一个基本的URL格式。 8. 验证电话号码: `\d{3}-\d{8}|\d{4}-\d{7}` 匹配中国大陆地区的电话号码格式。 9. 验证QQ号: `[1-9][0-9]{4,}` 用于确认输入是否为有效的QQ号码,至少5位且第一位不为0。 10. 验证6位纯数字的密码: `\d{6}` 对于要求6位纯数字的密码进行验证。 11. 验证长度5-16位,包含字母和数字的用户名: `^[a-zA-Z][a-zA-Z0-9_]{4,15}$` 用于验证符合指定规则的用户名。 12. IP地址验证: `\d+\.\d+\.\d+\.\d+` 匹配IPv4地址的标准格式。 13. 正负整数和零的验证: - `^[1-9]\d*$` 验证正整数 - `^-[1-9]\d*$` 验证负整数 - `^-?[1-9]\d*$` 验证正负整数 14. 小数验证: - `^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$` 验证正数小数 - `^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$` 验证负数小数 - `^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$` 验证正负小数或零 15. 全英文字符验证: - `^[A-Za-z]+$` 验证由26个英文字母组成的字符串 - `^[A-Z]+$` 验证由26个大写英文字母组成的字符串 - `^[a-z]+$` 验证由26个小写英文字母组成的字符串 16. 全英文数字字符验证: - `^[A-Za-z0-9]+$` 验证由26个英文字母和数字组成的字符串 - `^\w+$` 验证由26个英文字母、数字及下划线组成的字符串 17. 邮箱地址验证(带额外限制): `^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+` 更严格的邮箱格式验证。 18. URL验证(带额外限制): `^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)` 对URL格式的进一步约束。 这些正则表达式在日常的编程和数据处理中非常实用,可以帮助进行数据清洗、格式校验和信息提取等工作。