JavaScript 正则表达式常用实例整理

1 下载量 147 浏览量 更新于2024-09-03 收藏 75KB PDF 举报
"这篇文档是关于正则表达式的常用模式集合,主要目的是为了方便记忆和快速查找。作者收集了一些常见的正则表达式实例,涵盖了匹配中文字符、双字节字符、空行、HTML标签、首尾空格以及处理IP地址和Email地址的表达式。这些表达式对于进行字符串处理、数据验证和网页解析等工作非常有用。" 正则表达式是一种强大的文本处理工具,用于搜索、替换和提取符合特定模式的字符串。在IT行业中,它们在各种编程语言和工具中广泛应用,如JavaScript、Python、Java等。以下是对给定文件中提到的一些正则表达式及其用途的详细解释: 1. 匹配中文字符的正则表达式:`[\u4e00-\u9fa5]` 这个表达式用来匹配Unicode范围内的所有中文字符。[\u4e00-\u9fa5]涵盖了GB2312标准中的基本汉字区和扩展A区,覆盖了大部分常用汉字。 2. 匹配双字节字符(包括汉字):`[^\x00-\xff]` 这个表达式匹配所有非ASCII字符,包括大多数的中文字符和其他多字节字符。ASCII字符集由\x00-\x7f表示,所以[^…]表示不在此范围内的字符。 3. 计算字符串长度:`String.prototype.len=function(){return this.replace(/[^\x00-\xff]/g,"aa").length;}` 这个函数通过将非ASCII字符替换为两个"aa",然后计算长度,从而得到包含双字节字符的字符串的实际长度,一个双字节字符计为2,ASCII字符计为1。 4. 匹配空行:`\n[\s|]*\r` 正则表达式用于匹配包含任意数量的空格或制表符的换行符,这通常用于删除或替换文本中的空白行。 5. 匹配HTML标记:`/<(.*)>.*<\/\1>|<(.*)\/>/` 这个正则表达式用于匹配完整的HTML标签,包括自闭合标签和有内容的标签。 6. 去除首尾空格:`(^\s*)|(\s*$)` 该表达式用于匹配字符串的开始和结束处的空格,常用于修剪字符串两侧的空白。 7. 转换IP地址为数值:`function IP2V(ip) {...}` 正则表达式`/(\d+)\.(\d+)\.(\d+)\.(\d+)/g`用于匹配IP地址格式,然后通过数学运算将每个部分转换为十进制数值。 8. 匹配Email地址:`\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` 这是一个广泛使用的Email地址验证正则表达式,但它可能无法涵盖所有合法的Email格式,但在很多场景下已经足够。 9. 匹配URL:`http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+` 这个表达式用于匹配HTTP或HTTPS开头的网址,但可能无法匹配所有复杂的URL结构。 掌握这些正则表达式可以帮助开发者更有效地处理字符串数据,提高代码的效率和可维护性。同时,了解和熟练运用正则表达式也是IT专业人员必备的技能之一。