正态分布：从发现到AI基础

需积分: 50 151 浏览量更新于2024-07-19 收藏 1014KB PDF 举报

"正太分布的前世今生.pdf" 这篇文档主要介绍了正态分布的历史和其在统计学中的重要性，特别是在人工智能领域的应用。正态分布，又称为高斯分布，因其优美的钟形曲线和在自然现象中的普遍性而备受推崇。在数理统计中，正态分布的概率密度函数以其简洁的数学表达式著称，是统计学中最美的公式之一。正态分布的发现并非一蹴而就，而是经历了漫长的历史过程。尽管我们经常在各种科学计算和数据分析中使用正态分布，但对其起源可能并不十分了解。文档中提到，棣莫弗和拉普拉斯在概率论的发展中起到了关键作用，他们分别对正态分布的早期形态进行了研究。棣莫弗的工作为后来的拉普拉斯奠定了基础，拉普拉斯则进一步发展了最小二乘法，这是一种基于正态分布假设的参数估计方法，至今仍是数据分析中的核心工具。最小二乘法在人工智能和机器学习中扮演着重要角色，它通过最小化预测值与实际观测值之间的平方误差来估计模型参数，这在回归分析和线性模型中非常常见。当数据近似服从正态分布时，最小二乘法可以提供最佳的线性无偏估计，并且具有良好的预测性能。文档还提到了高斯在正态分布历史中的影响力。尽管正态分布并非由他首先发现，但他的工作极大地推动了正态分布的接受和应用。高斯的贡献不仅限于数学，他的肖像曾被印在德国货币上，这显示了他在科学界的崇高地位。正态分布的广泛应用源于其广泛存在于自然界和社会科学的各种随机变量中，例如人的身高、体重、智商分数等。它的中心极限定理指出，大量独立同分布随机变量的均值趋向于正态分布，这是其在统计推断中不可或缺的原因。在人工智能领域，正态分布常用于模拟和解释数据噪声，以及在神经网络中作为激活函数或权重初始化的分布。文档中提到的故事和历史背景揭示了正态分布的发现和发展的复杂性，同时也强调了理解一个数学概念背后的历程和理论的重要性。通过深入学习正态分布的来龙去脉，我们可以更好地理解和应用这一统计学上的重要工具，从而在处理和分析数据时做出更明智的决策。

勒让德(Legendre)

以上涉及的问题，我们直接关心的目标量往往无法直接观测，但是一些相关的量是可以观测到的，而通过建立数

学模型，最终可以解出我们关心的量。这些问题都可以用如下数学模型描述：我们想估计的量是，另有

若干个可以测量的量，这些量之间有线性关系

如何通过多组观测数据求解出参数呢？欧拉和拉普拉斯采用的都是求解线性方程组的方法。

但是面临的一个问题是，有组观测数据，个变量，如果，则得到的线性矛盾方程组，无法直接

求解。所以欧拉和拉普拉斯采用的方法都是通过一定的对数据的观察，把个线性方程分为组，然后把每个

组内的方程线性求和后归并为一个方程，从而就把个方程的方程组化为个方程的方程组，进一步解方程求

解参数。这些方法初看有一些道理，但是都过于经验化，无法形成统一处理这一类问题的一个通用解决框架。

以上求解线性矛盾方程的问题在现在的本科生看来都不困难，就是统计学中的线性回归问题，直接用最小二乘法

就解决了，可是即便如欧拉、拉普拉斯这些数学大牛，当时也未能对这些问题提出有效的解决方案。可见在科学

研究中，要想在观念上有所突破并不容易。有效的最小二乘法是勒让德在1805年发表的，基本思想就是认为测量

中有误差，所以所有方程的累积误差为

我们求解出导致累积误差最小的参数即可。

勒让德在论文中对最小二乘法的优良性做了几点说明：

最小二乘使得误差平方和最小，并在各个方程的误差之间建立了一种平衡，从而防止某一个极端误差取得支配地位•

计算中只要求偏导后求解线性方程组，计算过程明确便捷•

最小二乘可以导出算术平均值作为估计值•

,　 , β

0

β

p

,,,yx

x

p

y= + + 　 +β

0

β

1

β

p

,　 , β

0

β

p





=+++　+y

1

β

0

β

1

x

11

β

2

21

β

p

p1

=+++　+(2)y

2

β

0

β

1

x

12

β

2

22

β

p

p2

　

=+++　+y

n

β

0

β

1

x

1n 

β

2

2n

β

p

pn 

n p+ 1 n > p + 1

np+1

np+1

累积误差

=∑(

观测值

理论值

)

(3)

β



=

arg min

β

∑

i= 1 

n

e

2

i

arg [ 　( + + 　 + )min

β

∑

i= 1 

n

y

i

β

0

β

1

1i

β

p

pi

]

2

分

享

到

页码，5/15(W)w

2013/1/12http://www.mysanco.com/index.php?class=wenku&action=wenku_item&id=106

剩余22页未读，继续阅读

河流儿

粉丝: 45

正态分布：从发现到AI基础

正态分布的前世今生归纳.pdf

正态分布前世今生高清无目录pdf

good-正态分布的前世今生.pdf

flickering火光摇曳_正态分布的前世今生

揭秘数据分析的钟形秘籍：正态分布的前世今生与应用

正态分布：自然界的神秘面纱与高斯传奇

正态分布并非万能：钟形曲线局限性及其影响

机器学习的概率论基石：正态分布的算法应用解析

预测未来：正态分布在回归分析中的数学基础

数学旅程：正态分布的数学推导与逻辑之美

最新资源