正则表达式实用大全

5星 · 超过95%的资源 需积分: 0 1 下载量 170 浏览量 更新于2024-09-14 收藏 22KB DOC 举报
"这篇文档提供了一系列常用的正则表达式,涵盖了中文字符、双字节字符、空白行、HTML标记、首尾空白字符、Email地址、网址URL、帐号合法性、国内电话号码、腾讯QQ号、中国邮政编码、身份证号码、IP地址以及各种数字类型的匹配规则。这些正则表达式在数据验证、文本处理和网络爬虫等领域有广泛应用。" 正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和分析字符串模式。在IT领域,尤其是编程、数据分析和网页开发中,正则表达式扮演着不可或缺的角色。 1. **匹配中文字符**:`[u4e00-u9fa5]` 这个正则表达式用于匹配中文字符,它包含了Unicode范围内的所有中文字符。 2. **匹配双字节字符**:`[^x00-xff]` 用于匹配除ASCII字符之外的双字节字符,如汉字等。 3. **匹配空白行**:`ns*r` 可以用来删除或查找文档中的空白行,其中`s`代表任何空白字符,`*`表示零个或多个,`r`是行结束符。 4. **匹配HTML标记**:`<(S*?)[^>]*>.*?|<.*?/>` 此正则表达式可匹配HTML标签,但对复杂的嵌套标记可能无法完全处理。 5. **匹配首尾空白字符**:`^s*|s*$` 可以删除字符串的首尾空白字符,如空格、制表符等。 6. **匹配Email地址**:`w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*` 这个正则表达式常用于表单验证,以确保输入的Email格式正确。 7. **匹配网址URL**:`[a-zA-z]+://[^s]*` 用于提取或验证URL地址,但可能无法匹配所有复杂情况。 8. **匹配帐号合法性**:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` 确保账号以字母开头,且包含字母、数字和下划线,长度在5到16个字符之间。 9. **匹配国内电话号码**:`d{3}-d{8}|d{4}-d{7}` 可以匹配中国标准的电话号码格式,如0511-4405222或021-87888822。 10. **匹配腾讯QQ号**:`[1-9][0-9]{4,}` 能识别腾讯QQ号码,最小从10000开始。 11. **匹配中国邮政编码**:`[1-9]d{5}(?!d)` 验证6位数字的中国邮政编码。 12. **匹配身份证**:`d{15}|d{18}` 匹配15位或18位的中国身份证号码。 13. **匹配IP地址**:`d+.d+.d+.d+` 用于提取IP地址的四个部分。 14. **匹配特定数字**:这些正则表达式分别用于匹配正整数、负整数、整数、非负整数、非正整数、正浮点数、负浮点数、浮点数、非负浮点数,是进行数字验证的关键工具。 这些正则表达式在实际应用中非常实用,可以帮助开发者快速、准确地处理和验证各种类型的数据。它们可以结合编程语言(如JavaScript、Python、Java等)进行更复杂的操作,提高代码的效率和准确性。