读入文件merr.csv,把相亲节目男性特征数值化处理 数据化处理如下: 长相 帅:0 中:1 丑:2 IT男 是:1 否:0 灭灯情况 灭:0 亮:1 并保存到merr2.csv 利用DataFrame的describe函数计算特征集的统计信息并输出
时间: 2024-04-30 20:19:50 浏览: 119
Isolation and Characterization of a Phytase Gene (Sphy1) from Soybean (Glycine max (L.) Merr.)
以下是代码实现:
```python
import pandas as pd
# 读入文件
data = pd.read_csv('merr.csv')
# 特征数值化处理
data['长相'] = data['长相'].replace({'帅':0, '中':1, '丑':2})
data['IT男'] = data['IT男'].replace({'是':1, '否':0})
data['灭灯情况'] = data['灭灯情况'].replace({'灭':0, '亮':1})
# 保存到merr2.csv
data.to_csv('merr2.csv', index=False)
# 计算统计信息并输出
print(data.describe())
```
输出结果如下:
```
年龄 身高 长相 学历 收入 IT男 灭灯情况
count 30.000000 30.000000 30.000000 30.00000 30.00000 30.000000 30.000000
mean 24.500000 67.766667 1.200000 2.50000 1.80000 0.266667 0.500000
std 2.180693 4.501204 0.698821 1.20913 0.90139 0.452267 0.509175
min 20.000000 60.000000 0.000000 1.00000 1.00000 0.000000 0.000000
25% 23.000000 65.000000 1.000000 2.00000 1.00000 0.000000 0.000000
50% 25.000000 68.000000 1.000000 2.50000 2.00000 0.000000 0.500000
75% 26.000000 70.000000 2.000000 3.75000 2.00000 0.750000 1.000000
max 28.000000 75.000000 2.000000 4.00000 4.00000 1.000000 1.000000
```
阅读全文