没有合适的资源?快使用搜索试试~ 我知道了~
首页总结:Bootstrap(自助法),Bagging,Boosting(提升) - 简书.pdf
资源详情
资源评论
资源推荐
2019/4/27 总结:Bootstrap(自助法),Bagging,Boosting(提升) - 简书
https://www.jianshu.com/p/708dff71df3a 1/15
总结:Bootstrap(自助法),Bagging,
Boosting(提升)
(/u/bf45ab693e69)
mrlevo520 (/u/bf45ab693e69) 关注
0.4 2016.11.17 18:23* 字数 3505 阅读 19382 评论 5 喜欢 42 赞赏 1
前言
最近在理清一些很必要的也很基础的东西,记录一下,结合网上和文献,自己也
有些易化使之更轻松理解,如有错误,请不吝赐教,多谢!
Bootstrap(自助法)
Bootstrap
是
一
种
抽样方
法
核
心
思想
这里写图片描述
子
样本
之于
样本
,
可
以
类
比
样本
之于
总
体
栗子:我要统计鱼塘里面的鱼的条数,怎么统计呢?假设鱼塘总共有鱼1000条,我是开
了上帝视角的,但是你是不知道里面有多少。
步骤:
2019/4/27 总结:Bootstrap(自助法),Bagging,Boosting(提升) - 简书
https://www.jianshu.com/p/708dff71df3a 2/15
1.
承
包
鱼
塘
,
不
让
别人
捞
鱼
(
规
定总
体分
布
不
变
)
。
2.
自
己
捞
鱼
,
捞
100
条
,
都
打
上
标
签
(
构
造
样
本
)
3.
把
鱼
放
回
鱼
塘
,
休
息
一
晚
(
使之
混
入
整
个
鱼
群
,
确
保之
后
抽
样
随
机
)
4.
开
始
捞
鱼
,
每次
捞
100
条
,
数
一
下
,
自
己
昨
天
标
记
的
鱼
有
多
少
条
,
占
比
多
少
(
一
次
重采
样
取
分
布
)
。
5.
重
复
3
,
4
步
骤
n
次
。
建
立
分
布
。
假设一下,第一次重新捕鱼100条,发现里面有标记的鱼12条,记下为12%,放回
去,再捕鱼100条,发现标记的为9条,记下9%,重复重复好多次之后,假设取置
信区间95%,你会发现,每次捕鱼平均在10条左右有标记,所以,我们可以大致
推测出鱼塘有1000条左右。其实是一个很简单的类似于一个比例问题。这也是因
为提出者Efron给统计学顶级期刊投稿的时候被拒绝的理由--"太简单"。这也就解释
了,为什么在小样本的时候,bootstrap效果较好,你这样想,如果我想统计大海
里有多少鱼,你标记100000条也没用啊,因为实际数量太过庞大,你取的样本相
比于太过渺小,最实际的就是,你下次再捕100000的时候,发现一条都没有标
记,,,这特么就尴尬了。。。
Bootstrap经典语录
Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。通过方差的
估计可以构造置信区间等,其运用范围得到进一步延伸。
就是一个在自身样本重采样的方法来估计真实分布的问题
当我们不知道样本分布的时候,bootstrap方法最有用。
整合多个弱分类器,成为一个强大的分类器。这时候,集合分类器(Boosting, Bagging
等)出现了。
什么是集成学习(ensemble learning)
了解boosting和bagging之前,先了解一下什么是集成学习,一句话,三个臭皮匠
顶个诸葛亮,一箭易折十箭难折,千里之堤溃于蚁穴,啊,跑题了。在分类的表
现上就是,多个弱分类器组合变成强分类器。
2019/4/27 总结:Bootstrap(自助法),Bagging,Boosting(提升) - 简书
https://www.jianshu.com/p/708dff71df3a 3/15
这里写图片描述
一句话,假设各弱分类器间具有一定差异性(如不同的算法,或相同算法不同参
数配置),这会导致生成的分类决策边界不同,也就是说它们在决策时会犯不同
的错误。将它们结合后能得到更合理的边界,减少整体错误,实现更好的分类效
果。
Bagging(bootstrap aggregation)
首
先
:
bagging
和
boosting
都
是
集
成学
习
(
ensemble learning
)
领
域
的
基
本
算
法
bagging:从训练集从进行子抽样组成每个基模型所需要的子训练集,对所有基模型预
测的结果进行综合产生最终的预测结果,
至
于为什么
叫
bootstrap aggregation
,
因
为
它
抽
取
训
练
样本
的
时
候
采
用的
就
是
bootstrap
的
方
法
!
Bagging
策
略
过
程
这里写图片描述
剩余14页未读,继续阅读
mhoy
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论5