pd.get_dummies
时间: 2024-05-18 13:11:13 浏览: 102
pd.get_dummies是一个pandas库中的函数,用于将分类变量转换为虚拟变量。引用展示了一个示例,其中data是一个包含"学号"、"性别"和"学历"三个列的数据框。通过调用pd.get_dummies(data)函数,可以将这些分类变量转换为虚拟变量,并生成相应的虚拟变量列。每个分类变量的每个唯一值都会生成一个新的列,并且在原始数据中,如果某个样本所属的类别为该列的唯一值,则在该列中的对应位置为1,否则为0。引用提供了一个类似的示例。如果要关注缺失值(NaN)这类特殊情况,可以设置dummy_na=True参数,以生成一个额外的列来表示缺失值。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [特征提取之pd.get_dummies()用法](https://blog.csdn.net/BigData_Mining/article/details/104105384)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文