正则表达式实用大全

2 下载量 181 浏览量 更新于2024-09-01 收藏 75KB PDF 举报
这篇资源主要介绍了正则表达式在匹配不同字符和字符串处理中的应用,尤其在JavaScript中的使用。正则表达式是编程语言中用于处理文本的强大工具,它可以帮助我们进行复杂的文本查找、替换和验证。 1. **匹配中文字符**: - 正则表达式:`[\u4e00-\u9fa5]` - 这个表达式用来匹配Unicode范围内的中文字符,该范围包含了所有常见的简体和繁体汉字。 2. **匹配双字节字符**: - 正则表达式:`[^\x00-\xff]` - 这个表达式用于匹配非ASCII字符,通常包括中文、日文、韩文等双字节字符。 3. **计算字符串长度**: - 应用:`String.prototype.len=function(){return this.replace(/[^\x00-\xff]/g,"aa").length;}` - 在JavaScript中,这个方法可以用来计算字符串的实际长度,对于双字节字符,它会视为两个字符,ASCII字符视为一个。 4. **匹配空行**: - 正则表达式:`\n[\s|]*\r` - 这个表达式用于匹配包含空格或制表符的空行。 5. **匹配HTML标记**: - 正则表达式:`/<(.*)>.*<\/\1>|<(.*) \/>/` - 此正则表达式用于找到HTML标签的开始和结束,包括自闭合标签。 6. **匹配首尾空格**: - 正则表达式:`(^\s*)|(\s*$)` - 用于删除字符串开始或结束处的空格,常用于字符串修剪。 7. **JavaScript中的trim函数**: - 应用:`String.prototype.trim=function(){return this.replace(/(^\s*)|(\s*$)/g,"");}` - 这是一个JavaScript实现的trim函数,用于移除字符串两端的空白字符。 8. **IP地址转换**: - 使用正则表达式`/(\d+)\.(\d+)\.(\d+)\.(\d+)/g`匹配IP地址,并通过数学运算将其转换为十进制数值。 - 或者,可以使用`split()`函数简单地分解IP地址并进行数值计算。 9. **匹配Email地址**: - 正则表达式:`\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` - 用于验证是否符合标准电子邮件地址格式。 10. **匹配网址URL**: - 正则表达式:`http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?` - 这个正则表达式可以识别基本的HTTP URL结构。 11. **去除字符串重复字符**: - 提到的算法程序存在错误,但未给出完整的代码。通常情况下,可以使用正则表达式配合替换功能来实现这一目的。 正则表达式是处理字符串时不可或缺的工具,通过熟练掌握和应用这些表达式,开发者可以在处理文本数据时大大提高效率和精确性。在Python、JavaScript、Java等众多编程语言中,正则表达式都扮演着重要的角色,用于数据验证、数据提取、字符串操作等多个方面。