编写python代码,对csv文件进行数据清洗
时间: 2023-03-21 11:00:53 浏览: 133
清洗数据通常包括以下步骤:
1. 去除重复行
2. 去除空值
3. 格式化数据类型
4. 删除不需要的列
下面是一个简单的Python代码示例,用于对CSV文件进行数据清洗:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 去除重复行
df.drop_duplicates(inplace=True)
# 去除空值
df.dropna(inplace=True)
# 格式化数据类型
df['column_name'] = df['column_name'].astype('data_type')
# 删除不需要的列
df.drop(['column_name'], axis=1, inplace=True)
# 保存清洗后的数据为新的csv文件
df.to_csv('clean_data.csv', index=False)
```
请根据实际需求修改代码中的文件名、列名和数据类型等参数。
阅读全文