没有合适的资源?快使用搜索试试~ 我知道了~
首页机器学习简答题笔记.docx
资源详情
资源评论
资源推荐
第一章 绪论
Part1 名词解释
训练过程中使用的数据集称为训练集,其中的每一个样本称为训练样本。
测试:学得模型后,使用该模型进行预测的过程,被预测的样本成为测试样本
假设:学得模型对应于数据的某种潜在规律,这种潜在的规律自身成为真相或真实
学习的过程就是为了找出或逼近真相,将这种模型成为学习器
样例:拥有标记信息的示例
分类:预测的是离散值,则称分类
回归:预测的是连续纸,则称回归
根据训练数据是否有标记信息分:监督学习(分类和回归)、无监督学习(聚类)
泛化:学得的模型适用于新样本的能力
假设空间之科学推理的两大基本手段——归纳与演绎
归纳:从特殊到一般的泛化,即从具体试试归纳到一般性规律
演绎:从一般到特殊的特化,即从基本原理推演到具体状况
归纳偏好:机器学习算法在学习过程中对某种类型假设的偏好
没有免费的午餐定理:
NLF 讲的是在不考虑具体问题的情况下,没有任何一个算法比另一个算法更优,甚
至没有胡乱猜测更好。不存在一个与具体应用无关的,普遍适用的“最优分类器”;学习算
法必须要作出一个与问题领域有关的“假设”,分类器必须与问题域相适应。但是,NFL 定
理的前提是,所有问题出现的机会相等、或所有问题都是同等重要。但是现实中,我们
往往会得到特定的数据,特定的分布,解决特定的问题,所以我们只需要解决自己关注
的问题,而不需要考虑这个模型是否很好的解决其他的问题。只有对于特定的问题,我
们比较不同模型的才有意义。不仅是机器学习,我们在做其他算法的时候也是这样,如
果不考虑实际解决的问题,很难说算法的优劣。
Note:在进行样本训练时,我们通常假设所有的样本独立同分布。
机器学习的应用:
在总统候选人第一次辩论后,分析出哪些选民将倒戈,为每一位选民找出一个最
能说服他的理由
精准定位不同选民群体,建议购买冷门广告时段,广告资金效率比 2008 年提高
18%
向奥巴马推荐,精选后期应当在什么地方展开活动--哪里有更多争取对象
借助模型帮助奥巴马筹集到创纪录的 10 亿美元
在生物信息、web 搜索、入侵检测、汽车自动驾驶、火星机器人、决策助手等方
面都有应用
习题 1.5:简述机器学习能在互联网搜索中的哪些环节起什么作用?
1.在向搜索引擎提交信息的阶段,能够从提交文本中进行信息提取,进行语义分析。
2.在搜索引擎进行信息匹配的阶段,能够提高问题与各个信息的匹配程度。
3.在向用户展示搜索结果的阶段,能够根据用户对结果感兴趣的程度进行排序。
补充知识点
关于假设空间和版本空间
假设空间:假设数据集有 3 种属性,第 1 个属性有 2 种取值,第 2 种属性有 3 种取
值,第 3 个属性有 2 种取值。因为每个属性有一个泛化取值(*),且还存在一个空集的情
况。所以可能的假设有(2+1)*(3+1)*(2+1)+1=37 种。再用空集表示没有正
例,假设空间中一共种假设。
版本空间:在现实问题中常面临很大的假设空间,我们可以寻找一个与训练集一致
的假设集合,称之为版本空间。版本空间从假设空间剔除了与正例不一致和与反例一致
的假设(根据经验,最后在求版本空间时,空集的那个假设常常也会去除),它可以看
成是对正例的最大泛化。
第二章 模型评估与选择
Part1 经验误差与过拟合
精确度=1-错误率
泛化误差:在新样本上的误差
过拟合:学习器把训练样本学得太好了,很可能已经把训练样本自身的一些特点当作了所有
潜在样本都具有的一般性质,这样会导致泛化能力下降
产生过拟合的原因:学习能力太强了
欠拟合:对训练样本的一般性质尚未学好
欠拟合产生的原因:学习能力低下
Part2 评估方法
Part3 性能度量
剩余35页未读,继续阅读
Philia_YF
- 粉丝: 7
- 资源: 3
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
- MW全能培训汽轮机调节保安系统PPT教学课件.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0