二元分类器效果指标不易受正负样本比例影响的是哪个?(d)
a.查全率
b.查准率
c.提升值
d. AUC
决策树算法只能做 2 值分类,不能做多值分类,对还是错?(b)
a.对
b.错
以下哪个算法属于非监督学习算法?(a)
a.聚类分析
b.逻辑回归
c.决策树
d.神经网络
下列哪些方法可以用来对高维数据进行降维?(abcd)
a.因子分析
b.主成分分析
c.奇异值分解
d.线性判别分析
逻辑回归分析需要对离散值做预处理,决策树则不需要,对还是错?(a)
a.对
b.错
中位数比平均数,更不容易受异常数据影响,对还是错?(a)
a.对
b.错
决策树中属性选择的方法有?(bcd)
a.信息值
b.信息增益
c.信息增益率
d. GINI 系数
以下哪个问题不是分类问题?(b)
a.用户流失模型
b.身高和体重关系
c.信用评分
d.营销响应
常用的排序算法中,平均时间复杂度为 O(n*logn)的有哪些?(acd)
a.堆排序
b.冒泡排序
c.快速排序
d.归并排序
简述 P-R 曲线、F1-score、ROC 曲线、AUC 的定义并分析其优劣。
参考答案:
P-R 曲线:纵轴为准确率 P、横轴为召回率 R; F1-score:(2×P×R)/(P+R)"; ROC
曲 线 : 纵 轴 为 TPR ( True"Positive"Rate ) , 横 轴 为 FPR ( False"Positive"Rate )
AUC 是 ROC 曲线下的面积 P-R 曲线下的面积不容易计算;并且当正负样本发生变化时,
评论0