没有合适的资源?快使用搜索试试~ 我知道了~
首页使用背景知识的有约束的K-均值聚类
资源详情
资源评论
资源推荐

摘 要
传统上,聚类被视为数据分析的无监督方法。但是,在某些情况下,除了数据
实例本身之外,还有关于问题域的信息。在本文中,我们将演示如何利用流行的 k
均值聚类算法来利用这些信息进行有利的修改。 在对六个数据集进行人为约束的实
验中,我们可以观察到聚类精度的提高。我们也将这种方法应用于从 GPS 数据中自
动检测道路车道的现实问题,并观察到聚类性能的激增。
1. 导语
聚类算法通常以无监督的方式使用。它们呈现出一组必须按照相似性概念归类
的数据。算法只能访问这些特征描述对象;它没有提供任何关于每个实例应该放置
在分区内的信息(例如标签)。但是,在实际应用领域中,实验者往往拥有一些可
以用来聚合数据的背景知识(关于域或数据集)。即使存在传统的聚类算法,也可
以利用这些信息的优势。因此,我们有兴趣将背景信息整合到聚类算法中。我们之
前曾使用经过修改的 COBWEB 版本(Fisher,1987)成功地使用了关于实例对的背
景信息来约束它们的聚类(Wagsta ff &Cardie,2000)。 K-means 是另一种流行的聚
类算法,已经用于各种应用领域,如图像分割(Marroquin &Girosi,1993)和信息
检索(Bellot &El-Beze,1999)。由于其广泛的使用,我们认为开发一个可以利用
















PcSword
- 粉丝: 1
- 资源: 2
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
最新资源
- Xilinx SRIO详解.pptx
- Informatica PowerCenter 10.2 for Centos7.6安装配置说明.pdf
- 现代无线系统射频电路实用设计卷II 英文版.pdf
- 电子产品可靠性设计 自己讲课用的PPT,包括设计方案的可靠性选择,元器件的选择与使用,降额设计,热设计,余度设计,参数优化设计 和 失效分析等
- MPC5744P-DEV-KIT-REVE-QSG.pdf
- 通信原理课程设计报告(ASK FSK PSK Matlab仿真--数字调制技术的仿真实现及性能研究)
- ORIGIN7.0使用说明
- 在VMware Player 3.1.3下安装Redhat Linux详尽步骤
- python学生信息管理系统实现代码
- 西门子MES手册 13 OpcenterEXCR_PortalStudio1_81RB1.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

评论0