python数据清洗代码
时间: 2023-08-27 17:07:09 浏览: 194
数据清洗是数据分析的一个重要步骤,通过清洗数据可以使得数据更加干净、准确,方便后续的数据分析工作。下面提供一些Python数据清洗的代码示例:
1. 删除重复行
```
df.drop_duplicates(inplace=True)
```
2. 删除空值行
```
df.dropna(inplace=True)
```
3. 替换空值
```
df.fillna(value, inplace=True)
```
4. 转换数据类型
```
df['col_name'] = df['col_name'].astype('data_type')
```
5. 去除字符串前后空格
```
df['col_name'] = df['col_name'].str.strip()
```
6. 去除特殊字符
```
df['col_name'] = df['col_name'].str.replace('[^A-Za-z0-9]+', '')
```
7. 修改列名
```
df.rename(columns={'old_name': 'new_name'}, inplace=True)
```
8. 合并列
```
df['new_col'] = df['col1'].astype(str) + df['col2'].astype(str)
```
9. 前向填充空值
```
df.fillna(method='ffill', inplace=True)
```
10. 后向填充空值
```
df.fillna(method='bfill', inplace=True)
```
阅读全文