非共现数据的二元化加权转化算法优化研究
68 浏览量
更新于2024-08-26
收藏 1.47MB PDF 举报
"姬波和叶阳东在2013年的《模式识别与人工智能》期刊上发表了一篇关于非共现数据的二元化加权转化算法的研究论文。他们针对范畴数据的序列化信息瓶颈算法(CD-sIB)存在的问题,即假设所有数据特征对二元化转化的贡献均等,提出了一个新的二元化加权转化方法。这种方法旨在通过突出非共现数据的代表性属性,抑制非代表性或冗余属性,以获得更优的共现表示。论文还提出了适用于随机分布数据的加权原则和无监督的计算方法,并构建了二元化加权转化算法。实验结果显示,该算法在聚类精度上优于其他算法。"
这篇论文的核心内容主要围绕以下几个知识点展开:
1. 非共现数据的二元化转化:在处理范畴数据时,二元化转化是一种常见的方法,将非二元特征转化为二元特征,以简化数据结构并提取关键信息。然而,对于非共现数据,即不同时出现的数据特征,传统的二元化方法可能无法充分反映其特性。
2. 信息瓶颈理论:CD-sIB算法是基于信息瓶颈理论的信息压缩方法,其目标是在保留尽可能多的有用信息的同时,去除冗余和噪声。但在实际应用中,该算法可能忽视了不同特征的重要性差异。
3. 特征权重:论文提出的二元化加权转化方法引入了特征权重的概念,根据特征的非共现性和重要性来调整权重,使得非共现数据的代表性得到强调,冗余或非代表性特征被削弱。
4. 无监督学习:所提出的算法具有无监督性,意味着它无需依赖预先标记的数据,可以根据数据本身的分布和内在规律进行自动学习和转化。
5. 随机分布数据的适用性:论文提出了适用于随机分布数据的加权原则,这表明算法可以适应各种复杂的数据分布情况,增加了其普适性和实用性。
6. 实验验证:通过实验对比,证明了该二元化加权转化算法在聚类任务中的优越性能,提高了数据转化的质量和后续分析的准确性。
这些知识点展示了非共现数据处理的创新方法,以及如何通过优化特征权重改善数据转化效果,为信息压缩、数据挖掘和机器学习等领域提供了新的思路。
2019-06-28 上传
189 浏览量
2020-03-28 上传
2021-05-13 上传
2021-04-22 上传
2020-03-25 上传
2021-07-10 上传
2021-12-30 上传
weixin_38565801
- 粉丝: 3
- 资源: 970
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫