python读取csv文件之后进行数据清洗,再对数据不同异常值进行不同的修改代码示例
时间: 2024-03-14 20:44:54 浏览: 82
python读取与写入csv格式文件的示例代码
5星 · 资源好评率100%
好的,下面是一个简单的示例代码,假设我们要读取一个名为 `data.csv` 的 csv 文件:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 数据清洗
# 去除缺失值
df = df.dropna()
# 去除重复值
df = df.drop_duplicates()
# 处理异常值
# 小于0的值替换为0
df.loc[df['col1'] < 0, 'col1'] = 0
# 大于100的值替换为100
df.loc[df['col2'] > 100, 'col2'] = 100
# 将字符串类型的数字转换为浮点型
df['col3'] = df['col3'].astype(float)
# 保存处理后的数据到新的csv文件
df.to_csv('cleaned_data.csv', index=False)
```
其中,`col1`、`col2`、`col3` 分别表示 csv 文件中的不同列,可以根据实际情况进行修改。在处理异常值时,我们使用了 `loc` 方法来定位需要修改的数据行和列,并使用赋值操作来修改值。最后,我们使用 `to_csv` 方法将处理后的数据保存到一个新的 csv 文件中。
阅读全文