用代码直接找出数据中所有类别型数据并重新建立一个dataframe,用代码表示
时间: 2024-05-06 08:19:42 浏览: 32
假设原始数据的dataframe为df,以下代码可以找出所有类别型数据并重新建立一个dataframe:
```python
import pandas as pd
# 找出所有类别型数据的列名
cat_cols = [col for col in df.columns if df[col].dtype == 'object']
# 重新建立一个dataframe,只包含类别型数据
df_cat = df[cat_cols]
# 输出类别型数据的dataframe
print(df_cat)
```
相关问题
找出一份数据中所有类别型数据,重新建立一个dataframe,用代码表示
假设原始数据中有以下几列数据:姓名、年龄、性别、职业、婚姻状况、教育程度、是否有子女。
其中,姓名、年龄和职业是数值型数据,性别、婚姻状况、教育程度和是否有子女是类别型数据。
以下是处理类别型数据的代码:
```python
import pandas as pd
# 假设原始数据已经读入到dataframe中,命名为df
# 创建一个新的dataframe,只包含类别型数据
df_categorical = pd.DataFrame({
'性别': df['性别'],
'婚姻状况': df['婚姻状况'],
'教育程度': df['教育程度'],
'是否有子女': df['是否有子女']
})
# 打印新的dataframe
print(df_categorical)
```
输出的结果应该类似于以下内容:
```
性别 婚姻状况 教育程度 是否有子女
0 男 已婚 硕士 是
1 女 未婚 本科 否
2 男 离婚 大专 是
3 女 已婚 本科 是
4 男 未婚 硕士 否
5 女 已婚 博士 是
6 男 未婚 大专 否
7 女 离婚 本科 否
8 男 已婚 博士 是
9 女 已婚 大专 是
```
可以看到,新的dataframe只包含类别型数据。
阅读全文