应用pandas库写一个python代码,功能是传入一个xlsx文件,将第一列的全部日期正则化。如将“2022年5月20日”改为“2022-05-20”
时间: 2024-03-26 17:36:06 浏览: 74
好的,以下是代码实现:
```python
import pandas as pd
import re
# 读取Excel文件
df = pd.read_excel("your_file.xlsx")
# 定义日期正则表达式
date_pattern = r'(\d{4})年(\d{1,2})月(\d{1,2})日'
# 对第一列进行正则化
df.iloc[:,0] = df.iloc[:,0].apply(lambda x: re.sub(date_pattern, r'\1-\2-\3', x))
# 输出结果
print(df)
```
其中,`read_excel`函数用于读取Excel文件;`date_pattern`是一个日期的正则表达式,可以匹配形如“2022年5月20日”这样的日期格式;`apply`函数用于对第一列的每个元素应用lambda函数,将其正则化;最后,输出结果即可。
阅读全文