python数据清洗openpyxl
时间: 2023-11-17 17:03:45 浏览: 225
Python中的openpyxl模块可以用于对Excel文件进行数据清洗。下面是一个简单的例子,演示如何使用openpyxl模块读取Excel文件并进行数据清洗:
```python
import openpyxl
# 打开Excel文件
wb = openpyxl.load_workbook('example.xlsx')
# 选择工作表
sheet = wb.active
# 遍历每一行数据
for row in sheet.iter_rows(min_row=2, values_only=True):
# 如果第一列数据为空,则跳过该行
if not row[0]:
continue
# 如果第二列数据小于0,则将其设置为0
if row[1] < 0:
row[1] = 0
# 如果第三列数据为字符串,则将其转换为数字
if isinstance(row[2], str):
row[2] = int(row[2])
# 输出清洗后的数据
print(row)
# 保存Excel文件
wb.save('example_cleaned.xlsx')
```
上述代码中,我们首先使用`openpyxl.load_workbook()`函数打开Excel文件,然后使用`wb.active`属性选择默认的工作表。接着,我们使用`sheet.iter_rows()`方法遍历每一行数据,并对每一行数据进行清洗。在本例中,我们对第一列数据为空的行进行了跳过,对第二列数据小于0的行进行了修正,对第三列数据为字符串的行进行了转换。最后,我们使用`wb.save()`方法将清洗后的数据保存到新的Excel文件中。
阅读全文