python对一个csv而文件进行数据清洗
时间: 2024-03-01 09:28:12 浏览: 79
moxing_python数据清洗_读取csv文件_数据清洗_
5星 · 资源好评率100%
要对一个csv文件进行数据清洗,可以使用Python的pandas库。以下是一个简单的数据清洗示例:
1. 导入pandas库和csv文件
```python
import pandas as pd
df = pd.read_csv('data.csv')
```
2. 删除重复行
```python
df.drop_duplicates(inplace=True)
```
3. 删除缺失值
```python
df.dropna(inplace=True)
```
4. 修改列名
```python
df.rename(columns={'old_name': 'new_name'}, inplace=True)
```
5. 修改数据类型
```python
df['column_name'] = df['column_name'].astype('int')
```
6. 修改数据格式
```python
df['date_column'] = pd.to_datetime(df['date_column'], format='%Y-%m-%d')
```
7. 保存清洗后的文件
```python
df.to_csv('cleaned_data.csv', index=False)
```
以上是一个简单的数据清洗示例,具体的清洗操作还需要根据实际数据情况进行调整。
阅读全文