最小二乘拟合
在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来
确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况
一种是两个观测量 x 与 y 之间的函数形式已知,但一些参数未知,需要确定未知参数的最
佳估计值;另一种是 x 与 y 之间的函数形式还不知道,需要找出它们之间的经验公式。后
一种情况常假设 x 与 y 之间的关系是一个待定的多项式,多项式系数就是待定的未知参数,
从而可采用类似于前一种情况的处理方法。
一、最小二乘法原理
在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观
测量看作没有误差,并把这个观测量选作 x,而把所有的误差只认为是 y 的误差。设 x 和
y 的函数关系由理论公式
y
=
f(x
;
c
1
,
c
2
,……
c
m
)
(0-0-1)
给出,其中 c
1
,
c
2
,……
c
m
是 m 个要通过实验确定的参数。对于每组观测数据
(x
i
,
y
i
)i=1,2,……,N。都对应于 xy 平面上一个点。若不存在测量误差,则这些数
据点都准确落在理论曲线上。只要选取 m 组测量值代入式(0-0-1),便得到方程组
y
i
=
f(x
;
c
1
,
c
2
,……
c
m
)
(0-0-2)
式中 i=1,2,……,m.求 m 个方程的联立解即得 m 个参数的数值。显然 N<m 时,
参数不能确定。
在 N>m 的情况下,式(0-0-2)成为矛盾方程组,不能直接用解方程的方法求得 m
个参数值,只能用曲线拟合的方法来处理。设测量中不存在着系统误差,或者说已经修正
则 y 的观测值 y
i
围绕着期望值 <f(x
;
c
1
,
c
2
,……
c
m
)> 摆动,其分布为正态分布,则
y
i
的概率密度为
,
式中 是分布的标准误差。为简便起见,下面用 C 代表(c
1
,
c
2
,……
c
m
)。考虑各
次测量是相互独立的,故观测值(y
1
,
y
2
,……
c
N
)的似然函数
.
取似然函数 L 最大来估计参数 C,应使
(0-0-3)
取最小值:对于 y 的分布不限于正态分布来说,式(0-0-3)称为最小二乘法准则。
若为正态分布的情况,则最大似然法与最小二乘法是一致的。因权重因子 ,故