理解大数据统计学：概率、描述统计与推断

需积分: 19 30 浏览量更新于2024-06-27 收藏 1.12MB PDF 举报

"大数据的统计学基础.pdf" 这篇资料主要探讨了大数据背景下统计学的基础知识，由讲师黄志洪和何翠仪在DATAGURU专业数据分析社区讲解。课程强调了概率论作为统计学基础的重要性，指出概率论为统计学提供了理论武器。古典概率论和现代概率论（由柯尔莫戈洛夫建立）是概率论的两个关键阶段，学习和应用概率论能够提升决策的智慧和准确性。统计学被分为描述统计学和推断统计学两部分。描述统计学通过数字和图表展示数据的集中和分散情况，如平均分、最高分、频数分布等。而推断统计学则根据样本数据推断总体特性，例如通过抽样检查估计整体质量合格率。统计学在经济学、医学、心理学等领域有着广泛应用。在统计学中，集中趋势是衡量数据中心位置的重要概念。常用的集中趋势度量包括均值、中位数和众数。均值，即算术平均数，能够反映出数据的平均水平，但易受极端值影响。中位数不受极端值影响，但对数据变化的敏感度较低。众数是数据中出现最频繁的数值，可能有一个、两个或不存在。每个度量都有其优势和局限性，适用于不同的数据集和分析目的。课程还给出了计算均值的例子，展示了如何比较不同组别的成绩。比如，小组A和小组B的数学考试成绩，通过计算平均分（均值）来判断哪一组的整体表现更好。此外，资料中还讨论了中位数的定义，指出当数据量为偶数时，中位数是中间两个数的平均值。众数的概念也被解释，它反映了数据的一般水平，适用于数值和非数值数据。通过这些基础知识的学习，读者能够更好地理解和应用统计学方法，特别是面对大数据时，这些工具和概念显得尤为重要。在实际问题解决和决策制定中，统计学方法提供了科学的依据和有效的分析手段。

大数据的统计学基础讲师黄志洪何翠仪

DATAGURU专业数据分析社区

均值

 均值： 





















󰇛



 



    



󰇜

 例：某次数学考试中，小组A与小组B的成员的成绩分别如下：

 A：70,85,62,98,92 B：82,87,95,80,83

 分别求出两组的平均分，并比较两组的成绩。

 组A：（70+85+62+98+92）/5=81.4

 组B：（82+87+95+80+83）/5=85.4

 组B的平均分比组A的高，就是组B的总体成绩比组A高

剩余33页未读，继续阅读

是空空呀

粉丝: 199

理解大数据统计学：概率、描述统计与推断

大数据基础知识.pdf

统计学基础知识.pdf

大数据的统计学基础

大数据,统计学.pdf

大数据的统计学02.pdf

大数据的统计学08.pdf

大数据的认知.pdf

大数据智能决策.pdf

大数据技术培训.pdf

旅游大数据平台方案.pdf

最新资源