python循环读取csv文件每一行,判断该行行业2位置是否为空值,是的话就按行业2分类
时间: 2024-12-02 13:21:54 浏览: 12
python 对csv数据的读取、空值、重复的删除、数据的保存为csv
在Python中,你可以使用pandas库来方便地处理CSV文件并进行条件操作。下面是一个示例,展示了如何遍历CSV文件的每一行,检查"行业2"列是否为空,并基于此将数据分为不同的类别:
```python
import pandas as pd
# 读取CSV文件
df = pd.read_csv('your_file.csv')
# 假设industry_2列是你想要检查的列名
# 将空值标记为特定的缺失值标识,例如NaN
df['industry_2'] = df['industry_2'].fillna("missing")
# 创建一个新列存储行业分类
df['category'] = np.where(df['industry_2'] == "missing", "未指定", df['industry_2'])
# 检查并打印分类结果
for index, row in df.iterrows():
if pd.isna(row['industry_2']): # 判断 industry_2 是否为空
print(f"第 {index+1} 行属于 '未指定' 类别")
else:
print(f"第 {index+1} 行属于 '{row['industry_2']}' 类别")
```
在这段代码中,我们首先读取CSV文件到一个DataFrame中,然后用`fillna()`函数将空值替换为"missing"。接着,我们用`np.where()`函数创建了一个新的列`category`,根据`industry_2`列的值进行分类。最后,通过`iterrows()`函数一行行遍历DataFrame,检查每个行业的状态并打印相应的信息。
阅读全文