大数据算法下线性次序与秩统计量的渐近正态性研究

版权申诉

PDF格式 | 793KB | 更新于2024-07-04 | 81 浏览量 | 举报

本文主要探讨的是大数据背景下算法中的两种重要统计量——线性次序统计量和线性秩统计量。这两种统计量在数理统计学中具有广泛的应用，因为它们能够处理大量数据并提供关键的推断结果。论文的核心内容集中在对这两种统计量的理论构建以及它们渐近正态性的研究。在引言部分，作者首先引入背景，假设有一个样本X = (X1, ..., Xn)，这些数据按照从小到大的顺序排列。线性次序统计量是对这个有序样本中的特定位置或排名进行统计分析，例如样本最小值、中位数等。而线性秩统计量则更关注个体间的相对位置，比如通过比较每个观测值与平均值的差值大小来量化其在整体序列中的位置。论文的第二章回顾了必要的预备知识，其中包括对凸函数的性质进行了详细介绍。凸函数在统计学中扮演着关键角色，它的一致性和单调性对于后续理论推导至关重要。这部分内容为构建线性次序统计量和线性秩统计量提供了坚实的数学基础。第三章是论文的主体部分，分为三个小节： 1. **线性次序统计量和线性秩统计量的定义和构造**：在这里，作者利用凸函数这一工具，设计了一种新的构造方法，将凸函数与数理统计相结合，构建出新的线性次序统计量和线性秩统计量模型。 2. **线性次序统计量的渐近正态性证明**：作者在此部分展示了他们新构造的线性次序统计量在样本量足够大时，其分布将趋向于标准正态分布的特性，这是统计推断的重要基石，表明了这些统计量在实际应用中的稳健性。 3. **线性秩统计量的渐近正态性证明**：类似于前一部分，作者进一步探讨了线性秩统计量的渐近性，证明了当样本规模增加时，它同样具备接近正态分布的特性。这为基于秩的统计分析提供了理论支持。结论部分可能会总结整个研究的主要发现，并指出这些结果如何扩展了现有理论，以及它们在大数据处理和算法设计中的潜在应用。同时，文中还包含了注释和参考文献，确保了研究的严谨性和科学性。这篇文章深入探讨了线性次序统计量和线性秩统计量的理论构建及其渐近正态性，这些成果对于理解大数据中的排序问题、优化算法以及统计推断具有重要意义。通过使用凸函数，作者提供了一种新颖且实用的方法来处理和分析海量数据，从而推动了统计学在大数据时代的进一步发展。

第一章引言

设样本

(X],

…

，

Xn)

把

X],

…

，

”

按小到大的顺序排列为

X(I)

⑵

•

(

则

(X1,

•••,-¥„)

称为样本

的次序统计量

(order

statistic)

有时也称为

次序样本

(order

sample)

次序样本在统计问题中有广泛的应用

，

其理论也有深入的发展.近半个世纪以

来

，

岀现了不少这个方面的专著

，

在一定程度上可以说

，

次序统计量的研究已经形

成了数理统计学和概率论的一个分支.

而对于次序统计量的线性组合

，

称为线性次序统计量

，

这种形式的统计量在应

用上很重要

，

例如

：

我们熟知的

分位点

、

极值

、

极差等

，

都是这种形式.并在一

定的条件下

，

可以证明具有渐近正态性.而对于统计量的渐近理论的重要性是不言

而喻的.为此

，

研究线性次序统计量的渐近性有着理论上和应用上的重要作用.

在

1968

年

Moore

得出了线性次序统计量的渐近性的一个较为一般的结果

(

见

[1,4]).

但是我们发现

Moore

的结果对于线性次序统计量的系数的构造是比较复杂

的

，

并且在其原文中的证明则更为复杂和烦琐

，

因此这样在实际应用上的意义事实

上就会有一定程度上的折扣

，

目前国内外对一般性的线性次序统计量的渐近性的研

究并不是很多

，

涉及的数学知识虽然不是很深

，

但是难度很大

，

由于对特定问题研

究的需要

，

大部分会集中在持殊的一类线性次序统计量的研究上

，

比如说我们上面

所讲的

分位点

、

极值

、

极差等

•

若将样本

】

…

，

按大小排列为

X(1

)

…

(

)

而

Xg)

则称

的秩为尽

，

而

(/?!,•••

,Rn

｝

称为秩统计量

(

Rankstatistic)

本身及由它派生

岀来的任何统计量都称秩统计量

，

如果只用到秩统计量的方法就称为秩方法

(

Rank

method)

秩方法在非参数统计中占有极重要的地位.著名统计学者

Hajek

写过一

本初等的非参数统计教科书

[7]

其内容全部是秩方法.著名统计学家

Lehmann

有

一本带应用色彩的专著

[8]

书名是

非参数统计

，

而副题是

基于秩的统计方

法

・

由此可以想象秩方法在非参数统计中的重要地位.而线性秩统计量是其中最

剩余16页未读，继续阅读

身份认证购VIP最低享 7 折!

30元优惠券

programyg

粉丝: 178

大数据算法下线性次序与秩统计量的渐近正态性研究

最新资源