python数据清洗
时间: 2023-08-25 15:11:12 浏览: 107
基于Python的交通流数据清洗.zip
5星 · 资源好评率100%
在Python中进行数据清洗可以使用多种方法。其中一种方法是使用列表推导式去除列名中的空格。首先,导入pandas库并读取CSV文件,然后获取列名列表。接下来,使用列表推导式对列名进行处理,去除空格。然后,删除重复值并重置索引。接着,填补"级别"列和"特色"列中的缺失值。最后,将清洗后的数据保存到CSV文件中。以下是一个示例代码:
```python
import pandas as pd
# 读取CSV文件
df = pd.read_csv("ResourceFile.csv")
# 列名列表
ClName = df.columns.values
# 使用列表推导式去除空格
df.columns = \[x.strip() for x in ClName\]
# 删除重复值并重置索引
df.drop_duplicates(inplace=True)
df.index = range(df.shape\[0\])
# 填补"级别"列和"特色"列中的缺失值
df.loc\[df.级别.isnull(),'级别'\] = "无级别"
df.loc\[df.特色.isnull(),'特色'\] = "未知"
# 保存文件
df.to_csv("ResourceFile.csv")
```
这段代码会对CSV文件进行数据清洗,包括去除列名中的空格、删除重复值、重置索引以及填补缺失值。清洗后的数据会保存到同一个CSV文件中。
#### 引用[.reference_title]
- *1* *2* [python数据清洗---实战案例(清洗csv文件)](https://blog.csdn.net/qq_45675449/article/details/115645184)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文