数据清洗python代码
时间: 2023-07-23 15:03:23 浏览: 118
python数据清洗
5星 · 资源好评率100%
数据清洗是数据分析过程中的重要一环,以下是一个简单的 Python 代码示例用于数据清洗:
```python
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
# 去除重复行
df = df.drop_duplicates()
# 去除空值
df = df.dropna()
# 去除异常值
df = df[(df['col'] >= min_value) & (df['col'] <= max_value)]
# 更改数据类型
df['col'] = df['col'].astype('int')
# 重命名列名
df = df.rename(columns={'old_col_name': 'new_col_name'})
# 重置索引
df = df.reset_index(drop=True)
# 保存数据
df.to_csv('cleaned_data.csv', index=False)
```
以上代码对数据进行了去重、去空、去异常、更改数据类型、重命名列名和重置索引等操作,并将清洗后的数据保存到了 CSV 文件中。在实际的数据清洗过程中,还需要根据具体情况进行其他的数据处理操作。
阅读全文