非参数统计方法在计算机科学中的应用

需积分: 3 6 下载量 56 浏览量 更新于2024-07-31 收藏 2.56MB PDF 举报
"该资源是一本关于非参数统计学的书籍,涵盖了计算机应用及相关专业领域的非参数统计方法,如非参数回归、概率密度估计等。由George Casella、Stephen Fienberg、Ingram Olkin等专家顾问推荐,是SpringerTexts in Statistics系列的一部分。书中还引用了其他统计学著作,包括Berger的《概率论与随机过程入门》、Bilodeau和Brenner的《多元统计学理论》、Blom的《概率论与统计学:理论与应用》等,涉及时间序列分析、重复测量数据分析、实验设计与分析等多个主题。" 非参数统计学是一种不依赖于数据分布特定形式的统计学分支,它不假设数据来自某一特定的概率分布,如正态分布。在非参数统计中,我们关注的是数据的顺序关系,而不是具体的数值。例如,非参数回归不假设因变量与自变量之间的关系具有特定形式,而是通过诸如核平滑、局部线性回归等方法来探索它们之间的关系。 概率密度估计是非参数统计中的一个重要概念,它用于估计未知概率分布的形状。常见的方法有Kernel密度估计,通过加权平均的方式将每个观测值周围的数据点考虑进来,形成一个连续的密度曲线,从而描绘出数据的整体分布。 非参数统计还包括许多其他方法,如Mann-Whitney U检验用于比较两个独立样本的分布,Kruskal-Wallis H检验则用于多个独立样本的排名数据比较,而Kolmogorov-Smirnov检验则用于检验样本是否来自某个已知的连续分布。 此外,资源中提到的书籍还讨论了时间序列分析,如Brockwell和Davis的《时间序列分析与预测》第二版,这是一个重要的统计领域,用于研究在时间上有序的数据。重复测量数据分析,如Davis的《重复测量数据分析》,处理的是同一对象在不同时间点收集的数据,这在医学研究和行为科学中非常常见。 设计和分析实验是统计学中的另一关键部分,Dean和Voss的著作则关注如何有效地设计实验以获得可靠的结果。图形探索性数据分析,如du Toit, Steyn, 和 Stumpf的作品,则强调通过图形工具来揭示数据的结构和模式,这是数据分析的初始阶段,有助于理解数据和发现潜在的关联。 这个资源为学习者提供了一套全面的非参数统计学知识体系,不仅覆盖了基础理论,还包括了实际应用方法,适合于计算机应用及相关专业的学生和研究人员深入理解和掌握非参数统计方法。