PHP常用正则表达式收藏与实战

需积分: 10 0 下载量 45 浏览量 更新于2024-07-25 收藏 67KB DOC 举报
PHP是一种广泛使用的脚本语言,在Web开发中尤其常见,特别是在服务器端编程。本文档提供了一系列PHP中常用的正则表达式,这些表达式涵盖了字符串处理、表单验证、数据清洗等多个场景,对开发人员的工作效率有着显著的帮助。 1. 匹配中文字符的正则表达式:`[\u4e00-\u9fa5]` - 这个正则表达式用于匹配Unicode范围内的中文字符,解决了在处理含有中文文本时常见的问题。 2. 匹配双字节字符:`[^\x00-\xff]` - 双字节字符包括汉字,这个表达式用于计算字符串的长度,因为中文字符通常占用两个字节。 3. 空白行匹配:`\n\s*\r` - 通过该正则表达式可以去除文本中的多余空白行,提高文本格式的整洁度。 4. HTML标记匹配:`<(\S*?)[^>]*>.*?</\1>|<.*?/>` - 虽然原始的HTML标记匹配可能不够全面,但这个改进版本可以识别大部分简单的嵌套标记,但仍需根据具体需求进行调整。 5. 首尾空白字符删除:`^\s*|\s*$` - 这个表达式对于清理文本中的前导和尾随空白字符非常有用,有助于格式一致性。 6. Email地址验证:`\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` - 正则表达式用于验证电子邮件地址的格式,确保用户输入的有效性。 7. URL匹配:`[a-zA-Z]+://[^\s]*` - 原始的URL匹配功能有限,但提供的这个版本能满足大多数基本的URL验证。 8. 用户账号验证:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` - 这个正则表达式用于检查账号是否符合字母开头,长度在5到16字节,且只允许字母、数字和下划线。 9. 国内电话号码:`\d{3}-\d{8}|\d{4}-\d{7}` - 匹配中国的固定电话号码格式,如区号加七位或八位数字。 10. 腾讯QQ号:`[1-9][0-9]{4,}` - 对于腾讯QQ号的匹配,由于从10000开始,所以这个正则表达式适用于验证。 11. 中国邮政编码:`[1-9]\d{5}(?!\d)` - 匹配六位或七位数字的中国邮政编码,排除继续的数字部分。 12. 身份证号码:`\d{15}|\d{18}` - 匹配15位或18位的中国大陆身份证号码。 13. IP地址匹配:`\d+\.\d+\.\d+\.\d+` - 提取和验证IP地址时,这个正则表达式非常实用。 14. 特定数字匹配: - `^[1-9]\d*$` - 匹配正整数 - `^-?[1-9]\d*$` - 匹配整数(包括负数) - `^[1-9]\d*|0$` - 匹配非负整数,即正整数和零。 掌握这些正则表达式,可以帮助PHP开发者更高效地处理字符串,提高代码的可读性和准确性。在实际项目中,结合具体业务需求,灵活运用这些工具,能够极大提升开发效率。