实用正则表达式大全:字符串处理与验证

需积分: 0 11 下载量 36 浏览量 更新于2024-08-27 收藏 27KB DOCX 举报
正则表达式是一种强大的文本处理工具,在计算机编程和日常文本操作中广泛应用,特别是在Java后端开发、数据验证和字符串处理中发挥着关键作用。本文档汇总了一些常见的正则表达式示例,涵盖了用户名、密码、十六进制值、电子邮件、URL、IP地址、HTML标签、Unicode编码、中文字符、双字节字符、空白行、HTML标记、首尾空白字符以及Email地址和网址的验证。 1. **用户名验证**: `/^[a-z0-9_A-Z]{3,16}$/` 用于检查输入的字符串是否由小写字母、数字、下划线或大写字母组成,且长度在3到16个字符之间。 2. **密码验证**: `/^[a-z0-9_-]{6,18}$/` 检查密码由小写字母、数字、短横线或下划线组成,长度在6到18个字符之间。 3. **十六进制值**: `/^#?([a-f0-9]{6}|[a-f0-9]{3})$/` 匹配以#开头的6位或3位十六进制颜色代码。 4. **电子邮箱验证**: `/\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*/` 用于检测有效的电子邮件地址格式。 5. **URL验证**: `/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w\.-]*)*\/?$/` 包括HTTP或HTTPS协议、域名和路径,可处理大部分常见URL。 6. **IP地址验证**: `/^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/` 检查IPv4地址的正确格式。 7. **HTML标签匹配**: `/<(\S*?)[^>]*>.*?</\1>|<.*?/>` 可以识别HTML标签,但可能无法处理复杂嵌套结构。 8. **匹配中文字符**: `[\u4e00-\u9fa5]` 或 `/^u4e00-u9fa5,{$0,}$/` 用于匹配Unicode编码范围内的汉字。 9. **匹配双字节字符**: `[^\x00-\xff]` 适用于识别非ASCII字符,如汉字。 10. **匹配空白行**: `\n\s*\r` 用于查找并删除空白行,包括换行符、空格和制表符。 11. **首尾空白字符**: `^\s*|\s*$` 可以移除字符串的首尾空白字符。 12. **其他**: 此文档还列举了其他一些正则表达式,如Email地址验证和更全面的URL匹配,这些都是在实际项目中常见的应用场景。 通过学习和理解这些正则表达式,开发者可以更好地处理和验证用户输入,确保数据的准确性和安全性。熟练运用正则表达式是提高工作效率和编写高效代码的关键技巧之一。