写一个csv数据清洗的代码
时间: 2024-05-02 13:17:28 浏览: 105
好的,以下是一个简单的CSV数据清洗代码示例:
```python
import csv
# 打开原始CSV文件和清洗后的CSV文件
with open('raw_data.csv', 'r') as raw_file, open('clean_data.csv', 'w', newline='') as clean_file:
# 读取原始CSV文件
reader = csv.reader(raw_file)
# 写入标题行
clean_file.write('Name,Age,Gender\n')
# 遍历每一行数据
for row in reader:
# 如果该行数据缺少某个字段,则跳过该行
if len(row) < 3:
continue
# 获取姓名、年龄和性别字段
name = row[0]
age = row[1]
gender = row[2]
# 去除姓名中的空格
name = name.replace(' ', '')
# 将年龄转换为整数
try:
age = int(age)
except ValueError:
continue
# 将性别转换为大写字母
gender = gender.upper()
# 写入清洗后的数据到文件中
clean_file.write(f'{name},{age},{gender}\n')
```
在这个例子中,我们假设有一个名为`raw_data.csv`的原始CSV文件,其中包含姓名、年龄和性别字段。我们将使用`csv`模块读取原始文件,并使用Python字符串方法和异常处理来清洗数据。最终,我们将清洗后的数据写入名为`clean_data.csv`的新文件中。
阅读全文