正则表达式:匹配与校验的实用总结
需积分: 3 71 浏览量
更新于2024-09-17
收藏 55KB DOC 举报
"正则表达式相关知识及常见模式"
正则表达式是用于处理文本字符串的模式匹配工具,能够高效地进行查找、替换、验证等操作。在给定的信息中,提到了一些常见的正则表达式模式及其用途:
1. 匹配中文字符:[\u4e00-\u9fa5]
这个正则表达式用于匹配Unicode范围内的中文字符,其范围是从\u4e00到\u9fa5,覆盖了大部分的简体和繁体汉字。
2. 匹配双字节字符(包括汉字):[^\x00-\xff]
在许多编码系统中,中文字符被表示为两个字节。这个正则表达式用于匹配所有非ASCII字符,也就是所有非\x00-\xff的字符,这通常包括汉字在内的多字节字符。
3. 匹配空白行:\n\s*\r
这个表达式用于识别并匹配文本中的空白行,`\n`代表换行符,`\s*`匹配零个或多个空格或制表符,`\r`表示回车符。这个组合可以有效地清除文本中的空行。
以下是一些其他常见的正则表达式模式:
- 非负整数匹配:^\d+$
- 正整数匹配:^[0-9]*[1-9][0-9]*$
- 非正整数匹配:^((-\d+)|(0+))$
- 负整数匹配:^-[0-9]*[1-9][0-9]*$
- 整数匹配:^-?\d+$
- 非负浮点数匹配:^\d+(\.\d+)?$
- 正浮点数匹配:^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
- 非正浮点数匹配:^((-\d+(\.\d+)?)|(0+(\.0+)?))$
- 负浮点数匹配:^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
- 浮点数匹配:^(-?\d+)(\.\d+)?$
- 英文字母字符串:^[A-Za-z]+$
- 大写字母字符串:^[A-Z]+$
- 小写字母字符串:^[a-z]+$
- 数字和字母字符串:^[A-Za-z0-9]+$
- 数字、字母或下划线字符串:^\w+$
- Email地址匹配:^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
- URL匹配:^(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$
- 计算字符串长度(考虑双字节字符):String.prototype.len=function()
这些正则表达式模式在处理各种数据格式验证、文本分析、数据清洗等方面非常实用。例如,你可以用它们来验证用户输入的邮箱格式是否正确,或是查找文本中的特定数字格式等。熟练掌握正则表达式能够极大地提高处理文本任务的效率。
2022-08-08 上传
2014-08-04 上传
2010-07-27 上传
2010-12-20 上传
2023-10-12 上传
2024-11-04 上传
hanggege123
- 粉丝: 0
- 资源: 1
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能