python 的pandas数据清洗
时间: 2023-12-26 19:28:11 浏览: 91
Python pandas 数据清洗 基础教程
以下是Python中使用pandas进行数据清洗的示例:
1. 删除缺失值:
```python
from numpy import nan as NA
data = Series([1, NA, 3.5, NA, 7])
print(data.dropna()) # 删除所有缺失值
print(data.dropna(thresh=2)) # 至少有2个非缺失值才保留
```
2. 填充缺失值:
```python
df = df.fillna(df.median()) # 使用中位数填充缺失值
print(df.fillna(df.mean())) # 使用平均值填充缺失值
```
3. 数据读取和处理:
```python
import pandas as pd
import numpy as np
import pymongo
# 从Excel文件中读取数据
data = pd.DataFrame(pd.read_excel('000.xlsx', index=False))
# 连接MongoDB数据库并读取数据
client = pymongo.MongoClient("mongodb://XX:XXXXX@192.168.3.7:2018", connect=False)
db = client["test"]
table = db["python"]
df = pd.DataFrame(list(table.find()))
```
阅读全文