python数据分析与挖掘实战数据清洗代码
时间: 2023-04-01 10:02:54 浏览: 162
第四章代码问题.docx
你好,我可以回答这个问题。Python数据分析与挖掘实战中,数据清洗是非常重要的一步,可以使用Pandas库进行数据清洗。以下是一个简单的数据清洗代码示例:
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 删除重复行
data.drop_duplicates(inplace=True)
# 删除缺失值
data.dropna(inplace=True)
# 修改列名
data.rename(columns={'old_name': 'new_name'}, inplace=True)
# 修改数据类型
data['column_name'] = data['column_name'].astype('int')
# 去除空格
data['column_name'] = data['column_name'].str.strip()
# 去除异常值
data = data[(data['column_name'] > ) & (data['column_name'] < 100)]
# 保存数据
data.to_csv('cleaned_data.csv', index=False)
希望能对您有所帮助。
阅读全文