读取文件“haberman-kmes.dat”生成名为 dft 的 DataFrame,并进行 如下操作: (1) 列名为“Class”中取值分别将“negative”和“positive”替换为数字 0 和 1,并统计 0 和 1 各自出现的频数;
时间: 2023-01-29 13:49:30 浏览: 170
首先,你需要使用 pandas 库中的 read_csv() 函数读取文件,将数据存储在一个名为 dft 的 DataFrame 中:
```
import pandas as pd
dft = pd.read_csv('haberman-kmes.dat', sep='\s+')
```
然后,你可以使用 replace() 函数替换 "Class" 列中的 "negative" 和 "positive" 为 0 和 1。例如:
```
dft['Class'] = dft['Class'].replace({'negative': 0, 'positive': 1})
```
最后,你可以使用 value_counts() 函数统计 0 和 1 各自出现的频数。例如:
```
counts = dft['Class'].value_counts()
print(counts)
```
这将输出类似于这样的结果:
```
0 negative
1 positive
```
你也可以使用类似于这样的语句来统计 0 和 1 各自出现的频数:
```
counts = dft['Class'].value_counts(normalize=True)
print(counts)
```
这将输出类似于这样的结果:
```
0 0.5
1 0.5
```
这些是统计 "Class" 列中 0 和 1 各自出现的频数的基本步骤。希望这对你有帮助!
阅读全文