杜克大学STA561概率机器学习课程讲义解析

需积分: 5 183 浏览量更新于2024-06-16 收藏 2.71MB PDF 举报

"杜克大学STA561概率机器学习讲义由Sayan Mukherjee教授撰写，涵盖了概率机器学习的基础知识和应用。这门课程旨在利用算法和概率方法从数据中学习，涉及统计学与计算机科学的交叉领域。课程讨论的主题包括频率统计学、机器学习算法以及贝叶斯方法。" 概率机器学习是一门融合了统计学、计算机科学和数学的学科，起源于20世纪50年代，由Arthur Samuels的工作奠定基础。它的目标是使计算机能够通过学习过程而不是显式编程来解决问题。Alan Turing在其著名论文中提出的"机器能思考吗?"这一问题，也为机器学习的诞生提供了思想源泉。课程的主要内容围绕使用算法来处理数据，特别是处理大数据集时面临的计算和推断挑战。机器学习的方法通常分为两类：程序员方法和贝叶斯方法。程序员方法关注找到适用于数据的高效算法，目标是在长期运行中保持低错误率。而贝叶斯方法则侧重于根据数据推断模型或参数的后验概率，虽然在某些情况下可能实施困难。在概率机器学习中，贝叶斯定理是核心概念，用于量化模型和数据之间的关系。公式P(M|D) = P(D|M)P(M) / P(D) 描述了在给定数据D的情况下，模型M的后验概率，其中P(D|M)是似然性，P(M)是先验概率，P(D)是数据的边缘概率。这个定理在频率主义和贝叶斯分析中都有应用。例如，在模式估计问题中，我们可以考虑从有限字母表中抽取的随机变量X。在这种情况下，我们可能想要估计抽样分布或学习概率模型，以便对未知的未来观测进行预测。这可以通过计算似然性、后验概率和先验概率来实现，以确定最可能的模型或参数。在实际应用中，概率机器学习广泛应用于各种领域，如自然语言处理、图像识别、推荐系统等。课程将深入探讨这些领域的具体算法，如朴素贝叶斯分类器、决策树、支持向量机以及深度学习模型，并结合实际案例进行讲解。杜克大学的STA561概率机器学习讲义将带领学生深入了解如何利用概率论和统计学工具构建和理解复杂的机器学习模型，同时强调计算效率和实际应用能力的培养。

14 S. MUKHERJEE，概率机器学习

具有单变量正态似然和上述先验的后验分布将是

Post(µ | x

, ..., x

) ∼ N



+ σ

x¯ +

+ σ





−1



3.2.1.2.固定均值，随机方差。我们将用两个参数化的尺度参数来表述这个设置：(1

) 方差 σ

，(2) 精度τ =

两个共轭分布是Gamma分布和逆Gamma分布（实际上它们是相同的分布，只

是重新参数化）

IG(α, β) : f(σ

) =

Γ(α)

(σ

)

−α−1

exp(−β(σ

)

−1

), Ga(α, β) : f(τ) =

Γ(α)

α−1

exp(−βτ ).

后验分布 σ

是

| x

, ..., x

∼ IG



α +

, β +



− µ)



后验分布 τ是毫不奇怪的

τ | x

, ..., x

∼ Ga



α +

, β +



− µ)



3.2.1.3. 随机均值，随机方差。我们现在将之前的先验结合起来，称之为贝叶斯分

层模型：

| µ, τ

iid

∼ N(µ, (τ)

−1

)

µ | τ ∼ N(µ

, (κ

τ)

−1

)

τ ∼ Ga(α, β ).

对于上述似然函数和先验分布，均值和精度的后验分布为µ |τ, x

, ..., x

∼ N



+ nx¯

n + κ

, (τ(n + κ

))

−1



τ | x

, ..., x

∼ Ga



α +

, β +



− x¯)

n + 1

(¯x −x

)



3.2.2. 多元正态分布

给定一个向量 x ∈ IR

，多元正态密度为

f(x) =

(2π)

p/2

|Σ|

1/2

exp



−

(x − µ)

−1

(x − µ)



我们将使用精度矩阵而不是协方差，并考虑以下贝叶斯分层模型：

| µ, Λ

iid

∼ N(µ, (Λ)

−1

)

µ | Λ ∼ N(µ

, (κ

Λ)

−1

)

Λ ∼ Wi(Λ

, n

精度矩阵使用Wishart分布建模

f(Λ; V, n) =

|Λ|

(n−d−1)/2

exp(−.5tr(ΛV

−1

))

nd/2

|V |

n/2

(n/2)

剩余126页未读，继续阅读

绝不原创的飞龙

粉丝: 4w+
资源: 1083

杜克大学STA561概率机器学习课程讲义解析

机器学习.pdf

斯坦福大学 机器学习讲义

大型医疗空间中康复景观发展及对策——以杜克大学医学院规划为启示.pdf

杜克大学计算机科学专业.pdf

杜克大学统计学本科专业.pdf

机器学习与智能通信.pdf

杜克大学——PLUSE预训练文件.docx

dukeundergraduateml.github.io:杜克大学本科生机器学习网站

杜克大学电子及计算机工程本科专业.pdf

信息时代杜克大学图书馆的战略规划研究.pdf

最新资源

斯坦福大学机器学习讲义