正则表达式教程:字符串匹配模式和规则

需积分: 1 0 下载量 44 浏览量 更新于2024-07-28 收藏 178KB DOC 举报
正则表达式教程 正则表达式(Regular Expression)是一种字符串匹配的模式,可以用来检查一个串中是否含有符合某个规则的子串,并且可以得到这个子串;根据匹配规则对字符串进行灵活的替换操作。 正则表达式学习起来其实是很简单的,不多的几个较为抽象的概念也很容易理解。之所以很多人感觉正则表达式比较复杂,一方面是因为大多数的文档没有做到由浅入深地讲解,概念上没有注意先后顺序,给读者的理解带来困难;另一方面,各种引擎自带的文档一般都要介绍它特有的功能,然而这部分特有的功能并不是我们首先要理解的。 1. 正则表达式规则: * 普通字符字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。 * 举例1:表达式"c",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3。 * 举例2:表达式"bcd",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。 2. 简单的转义字符: * 一些不便书写的字符,采用在前面加"\"的方法。这些字符其实我们都已经熟知了。 * 举例:表达式"\r,\n",代表回车和换行。 * 举例:表达式"|符",代表竖线符号。 * 举例:表达式"\t",代表制表符。 * 举例:表达式"\\", 代表"\"本身。 * 还有一些在后边章节中有特殊用处的标点符号,在前面加"\\"后,就代表该符号本身。 * 举例:表达式"\^",匹配^符号本身。 * 举例:表达式"\$", 匹配$符号本身。 * 举例:表达式"\.", 匹配小数点(.)本身。 3. 能够与'多种字符'匹配的表达式: * 正则表达式中的一些表示方法,可以匹配'多种字符'中的任意一个字符。 * 举例:表达式"d", 可以匹配字符串"abcde"中的"d"字符。 正则表达式是一种强大的字符串匹配模式,可以用来检查一个串中是否含有符合某个规则的子串,并且可以得到这个子串;根据匹配规则对字符串进行灵活的替换操作。