常用正则表达式收藏:从中文字符到Email匹配

需积分: 9 1 下载量 3 浏览量 更新于2024-11-27 收藏 88KB DOC 举报
"这篇文档详述了正则表达式的使用,包括一些经典的正则表达式模式,用于字符串处理、表单验证等场景。作者收集并分享了这些常用的表达式,以便于查阅和记忆。文档中还包含了一些示例,如计算字符串长度、去除首尾空格、匹配和转换IP地址以及验证Email地址格式的方法。" 正则表达式是编程中的一种强大工具,用于模式匹配和字符串处理。以下是对标题和描述中涉及知识点的详细说明: 1. **匹配中文字符的正则表达式**:`[\u4e00-\u9fa5]` 这个正则表达式用于匹配所有中文字符,范围从Unicode的4e00到9fa5,覆盖了大部分的汉字。 2. **匹配双字节字符**:`[^\x00-\xff]` 这个表达式用来匹配所有非ASCII字符,包括汉字在内的双字节字符。ASCII字符由`\x00`到`\xff`表示,所以`[^...]'`表示排除这些字符,即匹配其他非ASCII字符。 3. **计算字符串长度**: 使用`String.prototype.len`函数,通过替换非ASCII字符为两个`a`字符,然后计算字符串长度,可以得到包含双字节字符的字符串的实际长度。 4. **匹配空行**:`\n[\s|]*\r` 这个正则表达式用于匹配包含任意数量的空格或制表符的空行。 5. **匹配HTML标记**:`/<(.*)>.*<\/\1>|<(.*)\/>/` 正则表达式用于查找完整的HTML标签,包括自闭合标签。 6. **匹配首尾空格**:`(^\s*)|(\s*$)` 这个表达式用于匹配字符串开头和结尾的空格,可用于实现类似JavaScript中的trim函数功能。 7. **利用正则表达式匹配和转换IP地址**: IP地址可以用正则表达式`/(\d+)\.(\d+)\.(\d+)\.(\d+)/g`进行匹配,通过`RegExp.$1`到`$4`获取每个数字部分,然后转换为十进制数值。 8. **匹配Email地址**:`\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` 这个正则表达式用于验证Email地址的格式,它能匹配常见的电子邮件地址结构。 通过学习这些经典正则表达式,开发者可以更有效地处理字符串,进行数据验证和格式化,提高编程效率。同时,掌握正则表达式有助于编写更加灵活和强大的代码。