全面解析:正则表达式常用模式

需积分: 10 2 下载量 108 浏览量 更新于2024-09-08 收藏 2KB TXT 举报
这篇内容主要对常用的正则表达式进行了总结,正则表达式是一种用于匹配字符串的强大工具,常用于文本检索、替换等操作。以下是一些常见的正则表达式模式及其对应的应用场景: 1. 数字相关: - `^\d+$`:匹配一个或多个连续的数字。 - `^[0-9]*[1-9][0-9]*$`:匹配至少有一个非零数字的序列。 - `^((-\d+)|(0+))$`:匹配负整数或零。 - `^-[0-9]*[1-9][0-9]*$`:匹配负整数(不包括-0)。 - `^-?\d+$`:匹配任意整数(包括正负)。 - `^(\d+(\.\d+)?|(\.\d+)?$`:匹配浮点数(允许小数点前有0)。 - `^((0-9)+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)$`:匹配浮点数(不允许整数部分全为0)。 - `^((-\d+\.\d+)?)|(0+(\.0+)?))$`:匹配浮点数(允许负0和小数点后有0)。 2. 字符串相关: - `^[A-Za-z]+$`:匹配仅包含英文字母的字符串。 - `^[A-Z]+$`:匹配仅包含大写字母的字符串。 - `^[a-z]+$`:匹配仅包含小写字母的字符串。 - `^[A-Za-z0-9]+$`:匹配字母和数字的组合。 - `^\w+$`:匹配单词字符(等同于`[A-Za-z0-9_]`)。 3. 邮箱验证: - `^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$`:匹配标准格式的邮箱地址。 4. URL验证: - `^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$`:匹配HTTP协议的URL。 - `^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$`:匹配通用URL。 5. 电话号码验证: - `^[1-9]\d{5}$`:匹配中国邮政编码。 - `^[\u0391-\uFFE5]+$`:匹配中文字符。 - `^((\(\d{2,3}\))|(\d{3}\-))?(\(0\d{2,3}\)|0\d{2,3}-)?[1-9]\d{6,7}(\-\d{1,4})?$`:匹配中国大陆地区的电话号码。 - `^((\(\d{2,3}\))|(\d{3}\-))?13\d{9}$`:匹配中国大陆地区的13位手机号码。 - `^((\(\d{2,3}\))|(\d{3}\-))?(\d{3,4}-)?\d{7,8}$`:匹配中国大陆地区的固定电话号码。 - `^((\(\d{2,3}\))|(\d{3}\-))?1\d{10}$`:匹配中国大陆地区的11位手机号码(包括145等特殊号段)。 - `^([1-9]{1}(\d+){5})`:匹配中国身份证号码的前15位数字。 6. 其他: - `^\x00-\xff`:匹配单个字节的字符(ASCII范围)。 - `(^\s*)|(\s*$)`:匹配字符串开头或结尾的空白字符。 - `vbscripttrim`:VBScript中的trim函数,用于去除字符串两侧的空白。 - `HTMLæ<(.*)>.*<\/\1>|<(.*)\/>`:匹配HTML标签。 - `[\s|]*\r`:匹配行结束符(包括空格和换行)。 - `(h|H)(r|R)(e|E)(f|F)*=*('|")?(\w|\\|\/|\.)+('|"|*|>)?`:匹配HTML链接。 - `(\d+)\.(\d+)\.(\d+)\.(\d+)`:匹配IPv4地址。 - `(86)*0*13\d{9}`:匹配中国大陆地区的1100开头的11位手机号码。 - `(\(\d{3,4}\)|\d{3,4}-|\s)?\d{8}`:匹配中国大陆地区的固话号码(含区号)。 - `(\(\d{3,4}\)|\d{3,4}-|\s)?\d{7,14}`:匹配中国大陆地区的固话号码或分机号。 - `[1-9]{1}(\d+){5}`:匹配中国邮政编码。 - `(-?\d*)\.?\d+`:匹配带符号的小数或整数。 这些正则表达式覆盖了常见的文本匹配需求,可用于数据验证、文本处理等多种场景。学习并熟练掌握正则表达式,能够大大提高处理文本数据的效率和准确性。