实用正则表达式大全

需积分: 0 0 下载量 173 浏览量 更新于2024-09-11 收藏 174KB PDF 举报
"这篇资源主要列举了在实际开发中常用的一些正则表达式,涵盖了整数、浮点数、字母组合、数字与字母组合、邮箱地址、URL、中文字符、双字节字符、空行、HTML标记以及首尾空格等多方面的匹配规则。" 在编程和数据处理中,正则表达式是一种强大的文本处理工具,用于查找、替换或提取符合特定模式的文本。以下是对标题和描述中提到的一些正则表达式的详细解释: 1. `^\d+$` - 这个正则表达式用来匹配非负整数,即0和所有正整数。`^` 表示开始,`\d` 代表数字,`+` 表示一次或多次,`$` 表示结束。 2. `^[0-9]*[1-9][0-9]*$` - 这个正则表达式用于匹配正整数,确保至少有一个数字不是0,防止匹配到纯零字符串。 3. `^((-\d+)?(0+))$` - 这个表达式匹配非正整数,包括负整数和0。`-` 表示可能的负号,`\d+` 匹配一个或多个数字,`0+` 匹配一个或多个0。 4. `^-?[0-9]*[1-9][0-9]*$` - 此正则表达式匹配负整数,允许前导0,但不能只包含0。 5. `^-?\d+$` - 匹配整数,包括正整数、负整数和0。 6. `^\d+(\.\d+)?$` - 这个表达式用于匹配非负浮点数,包括正浮点数和0。 7. `^(([0-9]+\.[0-9]*[1-9][0-9]*)?([0-9]*[1-9][0-9]*\.[0-9]+)?([0-9]*[1-9][0-9]*))$` - 匹配正浮点数,确保小数部分至少有一位非零数字。 8. `^((-\d+(\.\d+)?)?(0+(\.0+)?))$` - 匹配非正浮点数,即负浮点数和0。 9. `^(-(([0-9]+\.[0-9]*[1-9][0-9]*)?([0-9]*[1-9][0-9]*\.[0-9]+)?([0-9]*[1-9][0-9]*)))$` - 匹配负浮点数。 10. `^(-?\d+)(\.\d+)?$` - 这是匹配浮点数的通用正则表达式,包括正、负和0。 11. `^[A-Za-z]+$` - 用于匹配仅由26个英文大写字母组成的字符串。 12. `^[A-Z]+$` - 同上,但仅匹配英文大写字母。 13. `^[a-z]+$` - 匹配仅由26个英文小写字母组成的字符串。 14. `^[A-Za-z0-9]+$` - 匹配由字母和数字组成的字符串。 15. `^\w+$` - 这个正则表达式匹配由数字、字母或下划线组成的字符串,`w` 是一个特殊字符,相当于 `[A-Za-z0-9_]`。 16. `^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$` - 用于验证电子邮件地址的格式是否正确。 17. `^[a-zA-z]+://` - 匹配URL的协议部分,如 "http://" 或 "https://"。 18. `[\u4e00-\u9fa5]` - 匹配中文字符,范围是Unicode中的中文字符集。 19. `[^\x00-\xff]` - 匹配双字节字符,包括但不限于汉字。 20. 用于计算字符串长度的正则表达式,通过将非ASCII字符替换为两个字符来计算长度。 21. `\n[\s?]*\r` - 匹配空行,`\n` 表示换行,`\s?` 匹配任意数量的空白字符。 22. `<(.*)>.*<\/\1>?<(.*)\/>` - 匹配HTML标签,可以是闭合的或自闭合的。 23. `(^\s*)?(\s*")` - 匹配首尾空格和引号,常用于文本清理。 掌握这些正则表达式可以帮助开发者在处理字符串时进行高效的数据验证、提取或替换操作,提高开发效率。在实际应用中,它们可以用于用户输入验证、数据清洗、文本分析等多个场景。