python数据清洗数据类型转换
时间: 2024-02-16 19:59:03 浏览: 103
在Python中,数据清洗和数据类型转换是数据处理的重要步骤之一。下面是一些常用的数据清洗和类型转换操作:
1. 字符串操作:
- 大小写转换:使用lower()函数将字符串转换为小写,使用upper()函数将字符串转换为大写。
- 字符串拼接:使用"+"操作符将多个字符串拼接在一起。
2. 数据类型转换:
- 字符串转整数:使用int()函数将字符串转换为整数。
- 字符串转浮点数:使用float()函数将字符串转换为浮点数。
- 整数/浮点数转字符串:使用str()函数将整数或浮点数转换为字符串。
3. 缺失值处理:
- 删除缺失值:使用dropna()函数删除包含缺失值的行或列。
- 转换为日期类型:使用to_datetime()函数将字符串或整数转换为日期类型。
- 转换为类别类型:使用astype()函数将数据转换为类别类型,可以减少内存占用。
5. 数据去重:
- 去除重复值:使用drop_duplicates()函数去除DataFrame中的重复行。
- 去除重复项:使用set()函数将列表或数组转换为集合,去除重复项。
阅读全文