归纳学习下连续型数据的高效区间划分方法
需积分: 0 146 浏览量
更新于2024-09-05
收藏 188KB PDF 举报
该篇论文深入探讨了"归纳式学习中连续型数据的区间划分问题",由陈秉正和韩春鹏两位作者在清华大学经济管理学院发表于2001年4月的《系统工程理论与实践》第4期,文章编号为100026788(2001)0420001207。在当前归纳式学习方法中,处理连续型样本数据的分组是一个关键挑战,因为这直接影响到生成的规则能够准确反映变量间的相互关系,进而影响新样本的识别能力。现有的解决方案对于连续数据的分组并未完全满足需求。
论文提出了一种创新的区间划分方法,首先基于类相关离散化策略,引入极大熵法进行初始区间划分。这种方法旨在找到一种既能保持数据特性又能最大化信息熵的方式,确保划分的合理性。接着,作者采用多因素优选法来动态调整这些区间的边界,这种优化过程考虑了多个影响因素,以提高划分的精度和稳定性。
论文的核心部分是引入二阶概率统计检验,将实际意义融入到区间合并的过程中,以确保划分结果不仅在统计上有效,而且在实际应用中有明确的实际含义。这种方法的目的是尽可能地减少噪声影响,同时保持数据之间的内在联系。
作者以中国宏观经济的某些指标为例,展示了新提出的区间划分方法的有效性。结果显示,这种方法能够有效地揭示这些指标间的复杂关系,并在实际应用中取得了良好的识别和分析效果。
论文的关键词包括归纳式学习、分类和离散化,强调了这项工作在机器学习领域的重要性和实用性。整体而言,这篇论文为处理归纳式学习中连续型数据的区间划分问题提供了一种新颖且实用的方法,为相关领域的研究者和实践者提供了有价值的参考。
2019-09-20 上传
902 浏览量
1042 浏览量
1575 浏览量
1239 浏览量
1187 浏览量
2731 浏览量
1596 浏览量
2024 浏览量
weixin_38744435
- 粉丝: 373
- 资源: 2万+
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常