python 提取excel单元格钟某个字后面的数字
时间: 2024-09-13 11:18:21 浏览: 56
【Python源码】Excel单元格信息获取.rar
在Python中,我们可以使用pandas库来处理Excel文件,并利用正则表达式来提取特定字符后面跟着的数字。下面是一个简单的例子:
```python
import pandas as pd
import re
# 加载Excel数据
df = pd.read_excel('your_file.xlsx')
def extract_numbers(text, delimiter):
# 使用正则表达式匹配数字,假设目标字符是逗号或其他特定字符
pattern = r'(\D*)(\d+)' # 匹配非数字字符后面跟随的数字
match = re.search(pattern, text)
if match:
# 如果找到匹配,则返回第二个组(数字部分)
return int(match.group(2))
else:
return None
# 对每个单元格应用函数
column_to_extract_from = 'YourColumn'
results = df[column_to_extract_from].apply(lambda x: extract_numbers(x, ',') or extract_numbers(x, '.'))
# 结果保存到新列或者直接打印
df['ExtractedNumbers'] = results
print(df)
```
在这个例子中,我们首先读取Excel文件,然后对指定列(如`YourColumn`)中的每个单元格应用`extract_numbers`函数,该函数会查找逗号或句点之后的数字。如果找不到数字,函数将返回`None`。
阅读全文