pandas数据清洗操作
时间: 2023-10-12 17:12:18 浏览: 83
Python pandas 数据清洗 基础教程
Pandas是一个强大的数据分析库,可以用于数据清洗和预处理。以下是几种常见的数据清洗操作:
1. 重命名列名:
```python
df.rename(columns={'old_name': 'new_name'}, inplace=True)
```
2. 删除列:
```python
df.drop(columns=['column_name'], inplace=True)
```
3. 删除重复行:
```python
df.drop_duplicates(inplace=True)
```
4. 替换值:
```python
df.replace({'old_value': 'new_value'}, inplace=True)
```
5. 缺失值处理:
```python
# 删除缺失值
df.dropna(inplace=True)
# 填充缺失值
df.fillna(value='new_value', inplace=True)
```
6. 数据类型转换:
```python
# 转换数据类型
df['column_name'] = df['column_name'].astype('new_type')
```
7. 字符串操作:
```python
# 字符串替换
df['column_name'] = df['column_name'].str.replace('old_str', 'new_str')
# 字符串分割
df['new_column'] = df['column_name'].str.split('delimiter', expand=True)
```
以上是一些常见的数据清洗操作,Pandas还有很多其他的功能和方法,可以根据实际情况进行使用。
阅读全文