python清洗出版时间列,保证出版时间格式统一yyyy-mm-dd hh:mm:ss
时间: 2023-07-19 07:37:05 浏览: 265
python数据清洗
5星 · 资源好评率100%
好的,我可以给您提供一个 Python 的代码片段来清洗出版时间列并保证格式统一。假设您的时间列名为 `publish_time`,您可以使用以下代码:
```python
import pandas as pd
# 读取数据文件
df = pd.read_csv('your_file.csv')
# 将时间列转换为 datetime 类型
df['publish_time'] = pd.to_datetime(df['publish_time'], format='%Y-%m-%d %H:%M:%S', errors='coerce')
# 将时间格式化为 yyyy-mm-dd hh:mm:ss
df['publish_time'] = df['publish_time'].dt.strftime('%Y-%m-%d %H:%M:%S')
# 保存数据文件
df.to_csv('your_file_cleaned.csv', index=False)
```
这段代码会将原始时间列转换为 datetime 类型,并使用 `to_datetime` 函数将时间格式转换为 yyyy-mm-dd hh:mm:ss 的格式。如果原始数据中存在格式错误的数据,`errors='coerce'` 参数可以将其转换为 NaT 值。最后,使用 `strftime` 函数将时间格式化为 yyyy-mm-dd hh:mm:ss 的格式,并将结果保存到新的数据文件中。
阅读全文