正则表达式中的元字符有哪些?
时间: 2024-09-12 19:03:31 浏览: 40
正则表达式中的元字符是一些具有特殊含义的字符,它们用于表示特定的模式。以下是一些常见的元字符:
1. `.`(点):匹配任意单个字符,除了换行符。
2. `*`:匹配前面的元素零次或多次。
3. `+`:匹配前面的元素一次或多次。
4. `?`:匹配前面的元素零次或一次。
5. `{n}` 或 `{m,n}`:指定前面的元素恰好出现 n 次或至少 m 次。
6. `{n,}`:指定前面的元素至少出现 n 次。
7. `{n,m}`:指定前面的元素出现 n 到 m 次。
8. `\d`:匹配数字(等同于 `[0-9]`)。
9. `\D`:匹配非数字字符。
10. `\w`:匹配字母、数字或下划线(等同于 `[a-zA-Z0-9_]`)。
11. `\W`:匹配非字母、数字或下划线字符。
12. `\s`:匹配空白字符(如空格、制表符等)。
13. `\S`:匹配非空白字符。
14. `^`:匹配输入字符串的开始位置。
15. `$`:匹配输入字符串的结束位置。
16. `[]`:字符集,匹配括号内的任何一个字符。
17. `()`:分组,用于捕获子模式。
18. `|`:逻辑或操作,匹配两个或多个模式中的任一。
这些元字符可以组合使用以创建复杂的模式匹配规则。在Python中,使用`re`模块来处理正则表达式。例如:
```python
import re
pattern = r'\d+' # 匹配一个或多个数字
text = 'The price is $123'
match = re.search(pattern, text)
if match:
print(match.group()) # 输出:123
```
在这里,`\d+`就是一个元字符组成的模式,表示一个或多个连续的数字。
阅读全文