没有合适的资源?快使用搜索试试~ 我知道了~
首页掌握这12条经验,对理解机器学习至关重要
掌握这12条经验,对理解机器学习至关重要
需积分: 9 49 浏览量
更新于2023-05-27
评论
收藏 1.18MB PDF 举报
掌握这12条经验,对理解机器学习至关重要 掌握这12条经验,对理解机器学习至关重要1 掌握这12条经验,对理解机器学习至关重要1
资源详情
资源评论
资源推荐

更多精彩,请关注公众号《机器学习算法与 Python 学习》
华盛顿大学 Pedro Domingos 教授的“A Few Useful Things to Know about Machine Learning”
这篇论文总结了机器学习研究者和从业者的 12 个宝贵经验,包括需要避免的陷阱、需要关注的
重点问题、常见问题的答案。希望这些经验对机器学习爱好者有一些帮助。
下载方式
方式一
文末点击阅读原文
方式二
对话框回复“20180629”
1. “表征+评估+优化”构成机器的主要内容!
构成机器学习算法的 3 部分:
表征(Representation):分类器必须用计算机可以处理的形式化语言来表示。相反地,为训练
模型选择一个表征就等同于选择可训练分类器的集合。这个集合称为训练模型的「假设空间」。
如果分类器不在「假设空间」中,那么它就不能由训练所得到。一个相关的问题是如何表征输入,
即使用哪些特征。
评估(Evaluation):需要一个评估函数来区分分类器的好坏。算法内部使用的评估函数可能与
分类器优化的外部评估函数不同,这是为了便于优化,并且是由我们下一节所要讨论的问题导致
的。
优化(Optimization):我们要用一种方法搜索得分最高的分类器。优化方法的选择对于提升模
型的效率非常关键。另外,如果评估函数具有一个以上的最优值,则优化方法有助于确定最后产
生的分类器。新的训练模型一开始常常使用现有的优化器,后来常会转而使用自定义的优化器。
2. “泛化能力”很关键,“测试数据”验证至关重要!
机器学习的主要目标是对训练集之外的样本进行泛化。因为无论有多少数据,都不太可能在测试
中再次看到完全相同的例子。在训练集上具有良好表现很容易。机器学习初学者最常犯的错误是
把模型放在训练数据中进行测试,从而产生成功的错觉。如果被选择的分类器在新的数据上进行















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0