常用正则表达式大全

需积分: 10 1 下载量 47 浏览量 更新于2024-11-11 收藏 6KB TXT 举报
【资源摘要信息】: 本文将介绍一些常用的正则表达式,这些表达式涵盖了日常工作中常见的文本匹配场景。正则表达式是一种强大的文本处理工具,它能够帮助我们快速、准确地匹配、查找、替换和验证字符串。 1. **中文字符范围**: `\u4e00-\u9fa5` 这个正则表达式用于匹配所有中文汉字,包括简体和繁体。在处理中文文本时非常有用。 2. **非ASCII字符排除**: `[^x00-xff]` 用于匹配除ASCII字符集之外的任何字符。如果你只想处理基本的ASCII字符,可以使用这个表达式来排除其他字符。 3. **任意字符与数量限制**: `ns*r` 表示零个或多个任意字符(除了换行符),其中`s`表示任意空白字符,`*`表示重复零次或多次,`r`表示不区分大小写。 4. **HTML标签匹配**: `<(S*?)[^>]*>.*?|<.*?/>` 这个正则表达式用于匹配HTML标签,包括自闭合标签。 5. **空白字符去除**: `^s*|s*$` 用于匹配字符串开头或结尾的空白字符,常用于字符串的两端清理。 6. **邮箱地址验证**: `w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*` 这个正则表达式用于验证邮箱地址的格式,包括用户名、@符号、域名和顶级域名部分。 7. **URL匹配**: `[a-zA-z]+://[^s]*` 用于匹配URL的开始部分,通常包括协议类型(如http或https)。 8. **数字验证**: - `^[1-9][0-9]{4,15}$` 用于验证长度为5-16位的数字字符串,常用于用户名或密码。 - `[1-9]d{5}(?!d)` 匹配中国大陆地区的电话号码,如13位或14位的手机号码。 9. **身份证号验证**: - `d{15}` 或 `d{18}` 验证15位或18位的中国身份证号码。 - `ip\d{3}-\d{8}|d{4}-\d{7}` 匹配中国大陆的固定电话号码格式。 10. **QQ号验证**: - `[1-9][0-9]{4,}` 用于验证10000及以上的QQ号码。 11. **浮点数验证**: - 各种浮点数的匹配规则,例如: - `^-?[1-9]d*\.d*$` 匹配可能带有负号、整数部分和小数部分的浮点数。 - `^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$` 匹配更加全面的浮点数格式,包括正负零、科学计数法等。 12. **字母验证**: - 各种纯字母的匹配规则,例如: - `^[A-Za-z]+$` 匹配由26个英文字母组成的字符串。 - `^[A-Z]+$` 仅匹配大写字母的字符串。 - `^[a-z]+$` 仅匹配小写字母的字符串。 13. **数字与字母混合验证**: - `^[A-Za-z0-9]+$` 匹配由26个英文字母和数字组成的字符串。 - `^w+$` 与上一个表达式类似,但还包括下划线 `_`。 14. **正则表达式模式验证**: - 正则表达式的元字符和量词的使用,如: - `^[0-9]*$` 仅匹配0个或多个数字。 - `^d{n}$` 匹配n个连续的数字。 - `^d{n,}$` 匹配n个或更多连续的数字。 - `^d{m,n}$` 匹配m到n个连续的数字。 15. **货币格式验证**: - `^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$` 用于匹配各种货币格式,如金额。 这些正则表达式是正则表达式库的基础,可以根据实际需求进行组合和扩展,以满足更复杂的文本处理任务。学习和熟练掌握这些表达式,将大大提高你在处理文本数据时的效率和准确性。