机器学习与数据挖掘百科全书(2nd) 中文版 part3

机器学习

需积分: 9 38 浏览量更新于2024-07-17 收藏 3.57MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"Encyclopedia of Machine Learning and Data Mining(2nd) 中文 part3 涉及到机器学习中的动态规划和平均奖励马尔可夫决策过程(MDP)的概念。" 在机器学习领域，动态规划(Dynamic Programming)是一种强大的优化工具，常用于解决复杂问题，特别是当问题可以分解成多个子问题时。在数据挖掘和机器学习中，动态规划可以应用于决策制定，特别是在强化学习的上下文中。平均奖励马尔可夫决策过程(Average Reward MDP)是强化学习的一个关键模型，用于寻找长期平均奖励最大化的策略。在这样的模型中，目标是找到一个策略，使得在无限时间步长内，从每个状态出发的平均回报最大化。这个平均回报可能依赖于初始状态，尤其是在MDP有多条路径（多链）的情况下。公式(5)和(6)展示了如何计算预期的平均奖励。这些等式涉及到马尔可夫链的平稳分布，以及在给定策略下的长期奖励。如果MDP是单链的，那么存在一个唯一的平均奖励(g)，不依赖于初始状态。相反，如果MDP是多链的，初始状态的选择可能影响长期奖励。一个重要的结果是，对于固定策略，平均奖励总是明确的。解决平均奖励MDP的能力取决于马尔可夫链的结构。MDP可以分为两类：单链和多链。单链MDP对应于每个确定性静态策略的转换矩阵只有一个循环类，而多链MDP则包含多个独立的循环类。在单链MDP中，任何静态策略的增益可以用一个数值来定义，因为长期行为不会受到初始状态的影响。相对值函数(v)和偏差(h)是评估不同状态之间长期奖励差异的工具，它们在策略改进中起到关键作用。解决平均奖励MDP的方法包括策略迭代(Policy Iteration)、值迭代(Value Iteration)和线性编程。策略迭代包括策略评估和策略改进两个步骤，其中策略评估用于计算给定策略的值函数，而策略改进则寻找能带来更高期望奖励的新策略。这部分内容深入探讨了动态规划在平均奖励马尔可夫决策过程中的应用，强调了解决这类问题的数学框架和方法，对于理解强化学习和智能决策制定有着重要的理论价值。

资源详情

资源推荐

400

Ensemble Learning

E f g

回归问题的偏差 - 方差 - 协方差理论。进一

步的细节，包括最近解除一些假设的工作

（Kuncheva 2004b）。

投票中的分类错误

集合，用模型的相关性表示。要理解这一点，

我们必须引入投票保证金的概念。两级问题

的投票余量，y 2 f - 1; C1g，是定义的，

组合规则

一个主要的分类问题的情况 -

m D

瓦特

吨

。

D yH.

/: (10)

合投票组合是最具挑战性的。

通常，没有

已知的整体分类错误分解为整齐的准确度

和分集组件。

二项式理论给出了最简单的

直觉，表明模型之间的相关性确实影响了

性能。

如果我们有

模型，每个模型具有

相同的错误概率

p Ph

。

/ y /

，假设它们出

现统计上独立的错误，则多数表决委员会

的错误概率如下：

如果边距为正，则示例被正确分类，如果是

负数，则示例未正确分类。对于数据分布，

预期保证金s D

m衡量正确类别的平均投

票数超过任何其他类别的平均投票的程度。

投票保证金越大，对分类的信心越大。布莱

曼的演出，

—

P.H.x/

y/ D

—

.H.

/ ¤ y/ D P

.yH.

/ < 0/ ¤

(11)

(9)

例如，在T 21集合成员的情况下，每个成员

具有误差p 0：3，多数表决错误将是0 026，

比单个错误提高一个数量级。但是，这仅适

用于统计上独立的错误。相关案例是一个悬

而未决的问题。相反，不同的作者提出了他

们自己的多数投票集合中多样性的启发式定

义。 Kuncheva（2004b）对若干建议的多样

性措施进行了广泛研究; 结论是“没有任何衡

量标准与多数投票准确性保持一致。 ”尽管

如此，有些被认为是用来表征集合方法表现

的近似指南，但不应该依赖于作为“最后一个

字”。多样性。 Kuncheva在这个案例中的推

荐是Q统计量（Kuncheva 2004b，

页。 299），由于其简单和易于计算。

Breiman（2001）采用了另一种方法，不

是将错误成分分开，而是对投票的泛化误差

进行约束

这里p是平均成对相关

各个模型的错误之间。因此，通过小p将泛

化误差最小化，并且使s尽可能接近1。在这

种情况下，高精度（大s /和高多样性（低p）

之间的平衡构成了权衡，尽管界限非常宽松。

摘要

总之，多样性的定义取决于问题。在回归问

题中，最优多样性是平方误差的偏差，方差

和协方差分量之间的权衡。在分类问题中，

利用线性组合器，存在将分类器相关性与集

合误差率相关联的部分理论。在使用投票组

合器的分类问题中，没有单一的理论框架或

多样性的定义。然而，缺乏对多样性的商定

定义并没有阻止研究人员试图实现它，也没

有阻碍该领域有效算法的进展。

Ensemble Learning

401

结论和现场指导

集合方法构成了过去十年中最强大和最准确

的学习算法（Caruana和Niculescu-Mizil，200

6）。已经开发了大量的启发式方法来随机

化集合参数，以生成不同的模型。可以说是

这一行

Ho TK（1998）用于构造决策森林的随机子空间

方法。 IEEE Trans Pattern Anal Mach Intell 20

（8）：832-844

Jacobs RA，Jordan MI，Nowlan SJ，Hinton GE（1

991）适应性的当地专家组合。神经计算 3

（1）：79-87

Kearns M，Valiant LG（1988）学习布尔公式或有

限自动机与因子一样难。技术报告TR-14-88，

哈佛大学艾肯计算实验室

Koltchinskii V, Panchenko D (2005) Complexities of

调查现在相当超额认购，

凸组合和边界的generaliza-

现在，有关非标准数据的研究方法也越来越

有趣。

€

聚类集成（斯切尔和戈什2003）是

适用于无监督学习的问题集合技术。具有非

平稳数据的问题，也称为概念漂移，正在受

到最近的关注（Kuncheva 2004a）。最新的

创新可以在两年一度的多分类系统国际研讨

会上找到（Roli等，2000）。

推荐阅读

Kuncheva（2004b）是该领域的标准参考，其

中包括对许多其他推荐读数的参考。此外，

布朗等人。（2005年）和Polikar（2006年）

提供了广泛的文献调查。 Roli等。（2000）

是一个致力于集成学习的国际研讨会系列。

Breiman L (1996) Bagging predictors. Mach Learn 24

(2):123–140

Breiman L（2001）随机森林。马赫学45（1）：5

-32

Brown G（2004）神经网络集成的多样性。博士

论文，伯明翰大学

Brown G，Wyatt JL，Harris R，Yao X（2005）多

样性创造方法：调查和分类。 J Inf Fusion 6

（1）：5-20

Caruana R，Niculescu-Mizil A（2006）监督学习算

法的经验比较。在：第23届机器学习国际会议

论文集。 ACM，纽约，第161-168页

Freund Y，Schapire R（1996）使用新的增强算法

进行实验。在：第十三届机器学习国际会议论

文集（ICML'96）。摩根考夫曼出版社，旧金

山，第148-156页

Geman S，Bienenstock E，Doursat R（1992）神经

网络和偏差/方差困境。神经计算4（1）：1-58

tion error in classification. Ann Stat 33(4):1455 Kro

gh A, Vedelsby J (1995) Neural network ensem-

bles，交叉验证和主动学习。 In：神经信息处

理系统的进展。麻省理工学院出版社，剑桥，

第231-238页

Kuncheva LI（2004a）用于改变环境的分类器套装。

在：多分类系统国际研讨会。计算机科学讲义，

第300卷。斯普林格，柏林

Kuncheva LI（2004b）结合模式分类器：方法和算

法。威利，纽约

Laplace PS（1818）Deuxieme补充了理论分析概率。

Gauthier-Villars，巴黎

Mease D，Wyner A（2008）证据与Boosting的统

计观点相反。 J Mach Learn Res 9：131-156

Melville P，Mooney RJ（2005）使用人工数据创

建合奏的多样性。 Inf Fusion 6（1）：99-111

Polikar R（2006）基于集合的决策系统。 IEEE Cir

c Syst Mag 6（3）：21-45

Ra¨tsch G, Mika S, Scho¨lkopf B, Mu¨ller KR (2

002) Constructing Boosting algorithms from SVMs:

an application to one-class classification. IEEE Tra

ns Pattern Anal Mach Intell 24(9):1184–1199

Rodriguez J, Kuncheva L, Alonso C (2006) Rotation f

orest: a new classifier ensemble method. IEEE Tra

ns Pattern Anal Mach Intell 28(10):1619–1630

Roli F，Kittler J，Windridge D，Oza N，Polikar R，

Haindl M等（编辑）2000-2009多分类器系统国

际研讨会论文集。计算机科学讲义。斯普林格，

柏林。可在以下网址获得：http：//www.inform

atik.uni-trier.de/ley/db / conf / mcs / index.html

Schapire RE（1990）弱学习能力。马赫学5：197-

227

Schapire RE（1999）简要介绍了提升技术。在：

第16届人工智能国际联合会议论文集。 Morgan

Kauf-mann，旧金山，第1401-1406页

Schapire RE（2003）机器学习的提升方法：概述。

在：Denison DD，Hansen MH，Holmes C，Ma

llick B，Yu B（编辑）非线性估算和分类统计

学讲义。斯普林格，柏林，第149-172页

Strehl A，Ghosh J（2003）Cluster ensembles - 一

个用于组合多个分区的知识重用框架。 J Mach

Learn Res 3：583-617

…

f g≤

—

≤

402 Entailment

Tumer K，Ghosh J（1996）综合分类器中的误差相

关和误差减少。连接Sci 8（3-4）：385-403

Ueda N，Nakano R（1996）集合估计的泛化误差。

见：IEEE神经网络国际会议论文集，第1卷，

第90-95页。 ISBN：0-7803-3210-5

理论。因此，上面的第一个解释是理论的模

型，但第二个解释不是因为解释不是第一个

条款的模型（作为鸟，正常我但飞行I /。使

用这些概念，现在可以验证上面的条件论T在

逻辑上包含了该条款

苍蝇： - 鸵鸟，正常。

蕴涵

同义词

含义; 逻辑后果

定义

蕴涵一词用于逻辑推理。形式上，当且仅当

T的所有模型也是c的模型时，逻辑公式T才

包含公式c。这通常表示为T€c并且意味着c

是T的逻辑结果或者c暗示c。

让我们详细说明命题逻辑的这个定义，其

中公式T可以是以下表达式：

苍蝇： - 鸟，正常。鸟：

- 黑鸟。鸟： - 鸵鸟。

在这里，第一个条款或规则可以被视为苍蝇，

如果正常和鸟类，即正常的鸟类飞行，第二

个和第三个条款，则说明黑鸟，分别为。鸵

鸟，是鸟类。然后，解释是将真值分配给命

题变量。例如，对于上述域名

fostrich, birdg fblackbird,

bird, normalg

是通过一组真实的命题变量指定的解释。这

意味着在第一种解释中，唯一真正的建议是

鸵鸟和鸟。解释指明了一种可能的世界。解

释我是一个条款h的模型：

;::: b

if and only if b

;:::; b

我和它是一个条约理论的模型，当且仅当它

是一个所有条款的模型

因为理论的所有模型也是这个条款的模型。

在机器学习中，使用蕴涵的概念作为覆盖

关系

€

归纳逻辑程序，其中假设是分句the-法

制前提，实例是条款，并且一个例子是由假

设覆盖，当它通过假设承担的责任。

Cross-References

€

Inverse Entailment

一般性的

逻辑

推荐阅读

Russell S, Norvig P (1995) Artificial intelligence: a m

odern approach, 2nd edn. Prentice Hall, Engle- wo

od Cliffs

实体解决方案

Indrajit Bhattacharya

and Lise Getoor

IBM印度研究实验室，印度新德里

马里兰大学，马里兰大学帕克分校，

美国

对真实世界实体的引用通常很多，更常见

于数据源之间，但也经常在单个数据源中。

由于多种原因（例如不正确的数据输入）

或多个实体的可能表示而出现歧义。鉴于

这种模糊的实体参考集合，实体解决的目

标

抽象

Entity Resolution

403

是发现唯一的底层实体集，并将每个引用

映射到其相应的实体。解决此类实体的重

要性对于消除冗余以及准确的实体级分析

是必要的。这是许多不同应用中出现的常

见问题，并且已经在计算机科学的不同分

支中进行了研究。作为实体解决的证据，

世界实体。实体解析的目标是从单个数据源

或多个数据源中获取一组不确定的实体引用

（或简称引用），发现唯一的底层实体集，

并将每个引用映射到其对应的实体。这通常

涉及两个子问题 - 将具有不同属性的引用标

识到同一实体，并对具有相同属性的引用进

行解析

传统方法考虑成对的sim-

通过将它们分配给不同的实体。

参考文献之间的差异，以及许多复杂的相

似性度量被提出来比较参考文献的属性。

最简单的解决方案将具有高于阈值的相似

性的参考对分类为指向同一实体。更复杂

的解决方案使用概率框架进行推理，并具

有成对概率。最近提出的实体解决方案的

相关方法在作为附加证据可用时使用了引

用之间的关系。这些方法不是针对每对参

考独立推理，而是共同推理相关的成对决

策而不是参考。关系族中的一项工作是使

用概率图形模型进行有监督或无监督的概

率学习，而另一个使用更具伸缩性的贪婪

技术来合并超图中的引用。除了提高实体

解决方案的准确性之外，这种关系方法还

会以底层实体之间的关系形式产生额外的

知识。

同义词

共同参考决议; 重复数据删除; 重复检测; 身份

不确定; 合并清除; 对象整合; 记录联动; 参考

对帐

定义

数据清理和集成中的一个基本问题（参见

€

数据准备）正在处理对实际数据的不确定和

不精确的引用。

动机和背景

实体解析是许多计算机科学领域中以不同形

式出现（并且被赋予不同名称）的常见问题。

示例包括计算机视觉，我们需要弄清楚两个

不同图像中的区域何时引用相同的基础对象

（对应问题），当我们想要确定哪些名词短

语指向相同的基础实体时的自然语言处理（c

o-参考分辨率）和数据库，在合并两个数据

库或清理数据库时，我们想确定两个元组记

录何时引用相同的真实对象（重复数据删除

和数据集成）。重复数据删除对于消除冗余

和准确分析非常重要。在信息集成中，确定

近似连接对于整合来自多个来源的信息非常

重要;

实体引用中的这种含糊不清可以

由于多种原因。通常，数据可能具有数据输

入错误，例如印刷错误。多种表示，例如缩

写，也是可能的。不同的数据库通常具有不

同的密钥 - 一个人数据库可以使用社会安全

号码，而另一个人使用姓名和地址。

传统的实体解析方法侧重于匹配解析实体

的不同引用的属性。但是，许多数据源在实

体引用中存在显式或隐式关系。这些关系

404

Entity Resolution

D f

E gD f

gDf

指示基础实体本身之间的关系。例如，人口

普查数据中的人员记录通过家庭关系（如兄

弟姐妹，父母和配偶）进行关联。研究人员

主要在他们的组织或他们的研究团体中进行

合作，因此相关研究人员的参考往往紧密地

联系在一起。统计关系学习中最近的实体解

析方法利用参考之间的关系来提高实体解析

准确度，并另外发现基础实体之间的关系。

Theory/Solution

作为实体解决问题的一个例子，考虑在类似

于DBLP，CiteSeer或PubMed的学术出版物数

据库中解析作者参考的任务。我们以下面的

四篇论文为例：

W. Wang，C。 Chen和A. Ansari，“小鼠免疫

模型”

W. Wang和A. Ansari，“更好的小鼠免疫模型”

L. Li, C. Chen, and W. Wang, “Measuring pro

tein-bound fluoxetin”

WW Wang和A. Ansari，“胆汁性肝硬化的自

身免疫”

现在想象一下，鉴于这四篇论文，我们想

要找出这些作者名称中的哪一个引用相同的

作者实体。该过程涉及确定纸1和纸2是否由

同一作者Wang撰写，或者他们是否是不同的

作者。我们需要回答关于数据库中所有类似

作者姓名的类似问题。

在这个例子中，事实证明有六个基本的作

者实体，我们称之为Wang1和Wang2，Chen1

和Chen2，Ansari和Li。这三个引用的名称为

“A”。安萨里“对应作者安萨里和名称为”L的

参考文献。李“作者李。但是，两个引用的

名称为“C”。陈“映射到两个

不同的作者Chen1和Chen2。同样，名称为

“W”的四个引用王“或”WW王“映射到两位不

同的作者。第一篇，第二篇和第四篇论文中

的“Wang”引用对应于作者Wang1，而来自第

三篇论文的“Wang”引用则映射到另一作者W

ang2。这个推论说明了识别“W”的双重问题。

Wang“和”WW Wang“作为同一作者并消除了

两个名称为”W“的歧义。王“作为不同的作者。

这在图1中以图示方式示出，其中对应于相

同作者的参考用相同的阴影。在实体解析过

程中，所有这些以及仅具有相同阴影的作者

引用应该被解析为对应于相同的底层实体。

形式上，在实体解析问题中，我们给出一

组参考R D

g，其中每个参考r具有属性r：A1; R：A

2，...，r：

，例如作者参考的观察名称和隶

属关系，如上面的例子中所示。引用对应于

一组未知实体 e

。

我们引入符号r：E来引用参考r对应的实体。

目标是恢复隐藏的实体组e

并且实体在给定

观察到的参考属性的情况下为各个参考标记r：

E。除了属性之外，在某些数据源中，我们

还以引用之间的关系形式提供信息，例如发

布数据库中作者引用之间的共同作者关系。

我们可以捕获一组超边 h

i的

关系

。每个超边h也可以具有捕获关系属性的

属性，我们将其表示为h：A1; H：A2; :::; h：

，我们使用h：R来表示它连接的引用集。

在我们的示例中，每个矩形表示对应于数据

库中的一个纸张的一个超边缘。对应于P ape

r 1的第一个超边缘具有标题“A mouse immuni

ty model”的属性，并连接具有名称属性“W”

的三个引用。王，“”C。陈，“和”A。安萨

里。 “参考r可以属于零或更多超边缘，我们

使用r：H来表示r参与的超边缘集合。例如，

如果我们有纸张，作者和场地参考，

剩余203页未读，继续阅读

changqingt27

粉丝: 0
资源: 21

机器学习与数据挖掘百科全书(2nd) 中文版 part3

Encyclopedia of Machine Learning and Data Mining 2nd.Edition.pdf

Encyclopedia of Machine Learning and Data Mining(2nd) 中文 part7

Encyclopedia of Machine Learning and Data Mining(2nd) 原英文，完整书签

Encyclopedia of Machine Learning and Data Mining(2nd) 中文 part6

Encyclopedia of Machine Learning and Data Mining(2nd) 中文 part5

Encyclopedia of Machine Learning and Data Mining(2nd) 中文 part4

Encyclopedia of Machine Learning and Data Mining(2nd) 中文 part2

Encyclopedia of Machine Learning and Data Mining(2nd) 无水印pdf

Encyclopedia of Machine Learning

EN_Encyclopedia of Machine Learning.pdf

Encyclopedia of Data Warehousing and Mining

Encyclopedia of Cryptography and Security 2nd

Encyclopedia of Learning & Memory

python中paramiko插件

fastcache-1.1.0-cp38-cp38-win_amd64.whl

【图像检索】基于matlab颜色特征图像检索（含直方图距离）【含Matlab源码 4145期】.md

【图像加密】基于matlab混沌结合小波变换图像加密【含Matlab源码 3223期】.md

基于Java的学生管理系统的实现与代码解析

最新资源