正则表达式精华：中文匹配、HTML标签与邮箱验证

需积分: 4 193 浏览量更新于2024-08-30 收藏 62KB PDF 举报

本篇文章汇总了日常工作中常用的正则表达式，帮助读者理解和掌握各种场景下的字符串匹配规则。以下是一些关键知识点： 1. **匹配中文字符**: - 表达式：`[u4e00-u9fa5]` - 评注：正则表达式 `[u4e00-u9fa5]` 是为了匹配Unicode范围内的中文字符，解决了在编程中处理中文文本时常见的难题。 2. **匹配双字节字符**: - 表达式：`[^x00-xff]` - 评注：双字节字符包括汉字，这个表达式用于计算字符串长度，一个双字节字符计为2个字符单位，而ASCII字符计为1个。 3. **删除空白行**: - 表达式：`ns*r` - 评注：`ns*r` 匹配任何数量的空白字符（包括空格、制表符等），可以用于清理文本中的多余空白行。 4. **匹配HTML标记**: - 表达式：`<(S*?)[^>]*>.*?|<.*?/>` - 评注：尽管这个表达式比网络上流传的一些版本好，但还是无法处理复杂嵌套的HTML标记，对于更高级的HTML解析可能不够强大。 5. **匹配首尾空白字符**: - 表达式：`^s*|s*$` - 评注：用于移除字符串两端的空白字符，适用于去除文本格式化时的多余空格。 6. **验证Email地址**: - 表达式：`w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*` - 评注：这是一个基础的Email地址验证模式，适合用于输入验证。 7. **匹配URL**: - 表达式：`[a-zA-z]+://[^s]*` - 评注：提供了一个更全面的URL匹配模式，能够处理大部分常见网址格式。 8. **验证账号**: - 表达式：`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` - 评注：用于检查账户名是否符合字母开头、长度在5-16字节且只包含字母、数字和下划线的规则。 9. **匹配电话号码**: - 表达式：`d{3}-d{8}|d{4}-d{7}` - 评注：适应中国电话号码格式，包括区号和本地号码。 10. **匹配腾讯QQ号**: - 表达式：`[1-9][0-9]{4,}` - 评注：限定于QQ号从10000开始的格式。 11. **匹配邮政编码**: - 表达式：`[1-9]d{5}(?!d)` - 评注：针对中国邮政编码，6位数字且最后一位不能为数字。 12. **匹配身份证号码**: - 表达式：`d{15}|d{18}` - 评注：覆盖15位和18位中国居民身份证号码。 13. **匹配IP地址**: - 表达式：`d+.d+.d+.d+` - 评注：用于提取和验证IP地址。 14. **匹配特定数字类型**: - 包括正整数、负整数、非负整数、正浮点数和负浮点数的匹配表达式，提供了多种验证选项。这些正则表达式是IT开发人员在处理文本数据时经常使用的工具，熟练掌握它们可以大大提高代码的效率和准确性。然而，实际应用中可能需要根据具体需求进行调整和优化，尤其是对于复杂的文本结构，可能需要结合其他方法或库来实现更精确的匹配。

日常收集整理正则表达式验证大全日常收集整理正则表达式验证大全

常用正则表达式大全！（例如：匹配中文、匹配html）

匹配中文字符的正则表达式： [u4e00-u9fa5] 　　

评注：匹配中文还真是个头疼的事，有了这个表达式就好办了　

　匹配双字节字符(包括汉字在内)：[^x00-xff] 　

　评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）　

　匹配空白行的正则表达式：ns*r 　

　评注：可以用来删除空白行

　匹配HTML标记的正则表达式：<(S*?)[^>]*>.*?|<.*? /> 　

　评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力　

　匹配首尾空白字符的正则表达式：^s*|s*$ 　　

评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式　　

匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 　

　评注：表单验证时很实用

　匹配网址URL的正则表达式：[a-zA-z]+://[^s]* 　　

评注：网上流传的版本功能很有限，上面这个基本可以满足需求　　

匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：

^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 　

　评注：表单验证时很实用　　

匹配国内电话号码：d{3}-d{8}|d{4}-d{7} 　

　评注：匹配形式如 0511-4405222 或 021-87888822 　

　匹配腾讯QQ号：[1-9][0-9]{4,} 　

　评注：腾讯QQ号从10000开始　

　匹配中国邮政编码：[1-9]d{5}(?!d) 　

　评注：中国邮政编码为6位数字

　匹配身份证：d{15}|d{18} 　

　评注：中国的身份证为15位或18位

　　匹配ip地址：d+.d+.d+.d+

　　评注：提取ip地址时有用　

　匹配特定数字：　　

^[1-9]d*$　　 //匹配正整数　

　^-[1-9]d*$ 　 //匹配负整数　

　^-?[1-9]d*$　　 //匹配整数　

　^[1-9]d*|0$　 //匹配非负整数（正整数 + 0）　

　^-[1-9]d*|0$　　 //匹配非正整数（负整数 + 0）　

　^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮点数　

　^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配负浮点数　

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38680764

粉丝: 3
资源: 903

正则表达式精华：中文匹配、HTML标签与邮箱验证

正则表达式验证工具，正则表达式校验工具

c++写的正则表达式验证工具

正则表达式验证金额格式

日常收集整理php正则表达式(超常用)

正则表达式日常收集整理(简单且实用)

最常用正则表达式集合

PHP常用正则表达式整理

Java正则表达式前瞻与后顾断言：深入理解Pattern类的高级特性

搜集整理的asp.net C#开发常用类

电子书籍-Linux命令大全搜索工具

最新资源