正则表达式实用大全

需积分: 50 0 下载量 197 浏览量 更新于2024-09-13 收藏 7KB TXT 举报
本文将介绍一些常用的正则表达式,这些表达式涵盖了中文字符、双字节字符、首尾空白字符、中国邮政编码、身份证号、HTML标签、IP地址、URL、邮箱、日期格式以及电话号码等多种常见场景的匹配规则。 1. 匹配中文字符的正则表达式:[\u4e00-\u9fa5] 这个正则表达式可以用来匹配所有中文字符,范围包括了Unicode中的汉字部分。 2. 匹配双字节字符:[^\x00-\xff] 双字节字符通常指的是非ASCII字符,这个表达式用于匹配那些不在ASCII字符集中的字符。 3. 匹配首尾空白字符的正则表达式:^s*|s*$ 这个表达式可以匹配字符串开头或结尾的任意数量的空格、制表符等空白字符。 4. 匹配中国邮政编码:[1-9]\d{5} 邮政编码由6位数字组成,这个正则表达式可以有效地识别出符合格式的中国邮政编码。 5. 匹配身份证号:^(\d{15}|\d{18}) 身份证号分为15位和18位两种,这个表达式可以匹配这两种情况。 6. 匹配HTML标签:<(S*?)[^>]*>.*?|<.*?> HTML标签通常以"<"开始,以">"结束,这个正则表达式用于提取HTML文档中的标签。 7. 匹配IP地址:d+.d+.d+.d+ IP地址由四个十进制数组成,每个数的范围是0到255,这个正则表达式可以匹配标准的IPv4地址。 8. 匹配URL:[a-zA-z]+://[^s]* URL通常以特定的协议(如http、https)开头,这个表达式可以匹配大部分URL格式。 9. 匹配邮箱地址:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 邮箱地址由用户名、@符号和域名组成,这个正则表达式可以识别出大部分合法的邮箱格式。 10. 日期格式匹配: - YYYY-MM-DD - YYYY/MM/DD - YYYY_MM_DD - YYYY.MM.DD 这些模式分别表示年-月-日、年/月/日、年_月_日和年.月.日的日期格式,可用于验证输入日期是否符合这些格式。 11. 电话号码匹配: - d{3}-d{8}|d{4}-d{7} 中国的电话号码通常是7位或8位,这个正则表达式可以匹配形如区号-电话号码的格式。 - 0511-4405222021-87888822 例子展示了具体的电话号码格式。 - [1-9]d{5}(?!d) 匹配6位的中国邮政区号,例如0511。 12. QQ号码匹配:[1-9][0-9]{4,} QQ号码至少由5位数字组成,且不能以0开头,这个正则表达式可以匹配有效的QQ号码。 以上正则表达式是编程中处理字符串时常用的工具,它们可以帮助我们快速准确地对文本进行过滤、查找和替换,极大地提高了代码的效率和灵活性。在实际应用中,可能需要根据具体需求进行微调,以适应更复杂的情况。