找出一份数据中所有类别型数据,重新建立一个dataframe,用代码表示
时间: 2024-04-29 10:22:45 浏览: 9
假设原始数据中有以下几列数据:姓名、年龄、性别、职业、婚姻状况、教育程度、是否有子女。
其中,姓名、年龄和职业是数值型数据,性别、婚姻状况、教育程度和是否有子女是类别型数据。
以下是处理类别型数据的代码:
```python
import pandas as pd
# 假设原始数据已经读入到dataframe中,命名为df
# 创建一个新的dataframe,只包含类别型数据
df_categorical = pd.DataFrame({
'性别': df['性别'],
'婚姻状况': df['婚姻状况'],
'教育程度': df['教育程度'],
'是否有子女': df['是否有子女']
})
# 打印新的dataframe
print(df_categorical)
```
输出的结果应该类似于以下内容:
```
性别 婚姻状况 教育程度 是否有子女
0 男 已婚 硕士 是
1 女 未婚 本科 否
2 男 离婚 大专 是
3 女 已婚 本科 是
4 男 未婚 硕士 否
5 女 已婚 博士 是
6 男 未婚 大专 否
7 女 离婚 本科 否
8 男 已婚 博士 是
9 女 已婚 大专 是
```
可以看到,新的dataframe只包含类别型数据。
相关问题
用代码直接找出数据中所有类别型数据并重新建立一个dataframe,用代码表示
假设原始数据的dataframe为df,以下代码可以找出所有类别型数据并重新建立一个dataframe:
```python
import pandas as pd
# 找出所有类别型数据的列名
cat_cols = [col for col in df.columns if df[col].dtype == 'object']
# 重新建立一个dataframe,只包含类别型数据
df_cat = df[cat_cols]
# 输出类别型数据的dataframe
print(df_cat)
```
利用pd.DataFrame()创建一个3行5列的表格型数据代码
你可以使用pd.DataFrame()函数创建一个3行5列的表格型数据。下面是一个示例代码:
```python
import pandas as pd
# 创建一个3行5列的表格型数据
data = {'col1': [1, 2, 3],
'col2': ['a', 'b', 'c'],
'col3': [4.5, 6.7, 8.9],
'col4': ['x', 'y', 'z'],
'col5': [True, False, True]}
df = pd.DataFrame(data)
# 打印DataFrame对象
print(df)
```
在上述代码中,我们使用一个字典data来定义数据,字典的键作为列名,对应的值作为每一列的数据。这里定义了5列数据,分别是col1、col2、col3、col4和col5。
然后,将字典data传递给pd.DataFrame()函数创建DataFrame对象。由于没有指定行索引,所以默认会使用0、1、2作为行索引。
最后,使用print()函数打印输出DataFrame对象。运行代码后,你会得到一个包含3行5列数据的表格型结构。
你可以根据需要自定义数据和列名,创建任意大小的表格型数据。