MATLAB统计分析笔记:集中趋势、变化与假设检验

1 下载量 34 浏览量 更新于2024-08-30 收藏 381KB PDF 举报
"MATLAB学习笔记(七)统计" 在MATLAB的学习中,统计分析是一个重要的领域,本笔记主要涵盖了叙述统计和推论统计两大部分。叙述统计关注数据集的集中趋势、变化情况以及可视化,而推论统计则涉及到假设检验。 一、叙述统计 叙述统计的目标是对数据集进行概括性描述。在MATLAB中,以下是一些关键的统计量: 1. 集中趋势:描述数据集中心位置的统计量。 - 平均数(mean):数据集所有数值的总和除以数据点的数量,是最常用的集中趋势指标。 - 中位数(median):将数据排序后位于中间位置的值,不受极端值影响。 - 众数(mode):出现频率最高的数值,可能不存在或有多个众数。 - 百分位数(prcitile):将数据分为100个等份,每个百分位数表示相应比例的数据点小于或等于该值。 1. 四分位数(quartile): - 四分位数包括第一四分位数(Q1,25%的数据点以下)、第二四分位数(Q2,中位数)、第三四分位数(Q3,75%的数据点以下)。 - 百分位数函数(prcitile)可用于计算任意百分位数。 1. 变化: - 范围(range):数据集中的最大值减去最小值,表示数据的变动范围。 - 四分位距(interquartile range, IQR):Q3 - Q1,是衡量数据分布分散程度的一个统计量。 - 最大值(max)和最小值(min):数据集中的最大和最小数值。 - 标准差(std):衡量数据波动程度,标准差越大,数据点相对于平均数的分散程度越高。 二、推论统计 推论统计用于根据样本数据推断总体特性,主要包括假设检验。 1. 假设估计: - ttest2 和 ttest 函数:进行双样本或单样本t检验,用于判断两个样本的均值是否来自相同总体,h=0表示接受零假设,h=1表示拒绝零假设,p值越小,拒绝零假设的证据越强。 - 默认情况下,显著性水平α=0.05,对应的置信水平为95%。 2. 其他假设检验方法: - ztest():基于标准差的Z检验,用于判断两个总体是否有显著差异。 - ranksum():威尔科xon秩和检验,评估两个独立样本的中位数是否相等。 - signrank():威尔科xon配对符号秩检验,适用于配对样本,检查两组配对数据的差异是否显著。 这些统计工具和函数在MATLAB中提供了丰富的数据分析能力,无论是在学术研究还是工程实践中,都能帮助我们理解并解释数据的内在规律和特征。通过熟练掌握这些统计方法,可以更好地进行数据探索和假设验证。