py正则化提取文本中的数字
时间: 2024-10-15 15:12:23 浏览: 35
在Python中,可以使用`re`模块来进行正则表达式操作,包括提取文本中的数字。正则表达式是一种强大的模式匹配工具,用于查找、替换或分割字符串中的特定模式。以下是使用`re`库中的`findall()`函数来提取文本中的所有数字的一个基本示例:
```python
import re
def extract_numbers(text):
pattern = r'\d+' # 正则表达式模式匹配一串连续的数字
numbers = re.findall(pattern, text)
return [int(num) if num.isdigit() else num for num in numbers] # 将找到的字符串转为整数,如果不能转换,则保留原样
# 示例
text = "这里有123个数字和45.67这个小数"
numbers = extract_numbers(text)
print(numbers) # 输出:[123, 45]
```
在这个例子中,`r'\d+'`匹配的是一个或多个数字字符。`findall()`会返回一个列表,其中包含所有匹配到的数字。
阅读全文