![](https://csdnimg.cn/release/download_crawler_static/87757980/bgb.jpg)
统计学习种类
统计学习一般分为两个主要类别:监督学习(predictive learning,
supervised learning ) 以 及 非 监 督 学 习 ( descriptive learning,
unsupervised learning),因为监督学习在实际中应用更为广泛,我们
将主要精力放在监督学习上。
1.1 监督学习
监 督 学 习 的 目 标 是 在 一 个 输 入 输 出 对 的 集 合 中 ( 训 练 集 )
D={(x_i,y_i)}_{i=1}^ND=(xi,yi)i=1N学习一个从输入变量 xx 到输出变量
(标签)yy 的映射,NN 是训练样本(采样)的数目。简单来看,x_ixi
可以是一个向量,例如一个人的身高,体重等,复杂来看 x_ixi可以是
一张图片,一句话,一封邮件,一个时间序列等等。输出 y_iyi可以是
连续的,也可以是离散的,当 y_iyi是连续的时,该学习问题被称为回
归(regression)问题,当 y_iyi是离散的时,该学习问题被称为分类
(classification)问题。
1.1.1 分类问题
分类问题的输出在 y\in\left{1,2,3,…,C\right}y∈{1,2,3,…,C}中取值,
C=2C=2 对应二分类问题,C>2C>2 对应多分类问题。