没有合适的资源?快使用搜索试试~ 我知道了~
首页机器学习: Metric Learning (度量学习) 学习笔记
机器学习: Metric Learning (度量学习) 学习笔记
需积分: 49 19 下载量 141 浏览量
更新于2023-03-16
评论 1
收藏 2.09MB PDF 举报
目前,机器学习中的K近邻(KNN)分类算法和支持向量机(SVM)算法被认为是处理文本分类的最好方法。但KNN分类算法有以下的缺陷: KNN是基于近邻度量的一种模式分类算法,它高度依赖于数据间的相似度度量,简单的欧式距离在实际应用时,由于不考虑不同维度之间对分类的影响以及输入数据数据维数高的问题,往往不能取得良好的分类效果。 KNN 分类算法虽然可以一定情况下克服数据偏斜带来的分类误差,但是这也是造成它对样本密度分布敏感的主要原因,当类间密度高度分布不均时,分类效果会有较大的影响。
资源详情
资源评论
资源推荐
Tutorial on Metric Learning
Aur´elien Bellet
Department of Computer Science
Viterbi School of Engineering
University of Southern California
Computational Intelligence and Learning Doctoral School
October 15, 2013
1 / 122
Quick advertisement
Recent survey
All the topics, methods and references covered in this tutorial (and others)
are discussed at more length in my recent survey (joint work with Amaury
Habrard and Marc Sebban).
Reference
Bellet, A., Habrard, A., and Sebban, M. (2013). A Survey on Metric
Learning for Feature Vectors and Structured Data. Technical report,
arXiv:1306.6709
Download from arXiv
http://arxiv.org/abs/1306.6709
2 / 122
Machine learning
Learn to generalize from examples
Data Learning Model
labeled
unlabeled
supervised
unsupervised
classification
clustering
3 / 122
Numerical and structured data
Numerical data
Each data instance is a numerical feature vector.
Example: the age, body mass index, blood
pressure, ... of a patient.
x =
26
21.6
102
. . .
Structured data
Each instance is a structured object: a string, a tree or a graph.
Examples: French words, DNA sequences, XML documents,
molecules, social communities...
ACGGCTT
4 / 122
Importance of metrics
Pairwise metric
Informally, a way of measuring the distance (or similarity) between objects.
Metrics are ubiquitous in machine learning
Get yourself a good metric and you’ve basically solved the problem.
Metrics are convenient proxies to manipulate complex objects.
Applications
Classification: k-Nearest Neighbors, Support Vector Machines...
Clustering: K -Means and its variants.
Information Retrieval / Ranking: search by query, image retrieval...
Data visualization in high dimensions.
. . .
5 / 122
剩余132页未读,继续阅读
cy_qiqi
- 粉丝: 0
- 资源: 8
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0