马赛克图与对数线性模型解析
需积分: 36 100 浏览量
更新于2024-08-09
收藏 4.68MB PDF 举报
"马赛克图-atj2259c datasheet_v1.0_100413"
马赛克图(Mosaic Plots)是一种强大的统计图形,尤其适用于展示多维列联表数据。不同于之前介绍的低维列联表展示方法,如交叉表或直方图,马赛克图没有维度限制,能够处理高维数据集。其基本原理是通过矩形块的大小来反映不同变量组合的频数比例,从而提供一个直观的视觉表示。
马赛克图的基础是对数线性模型,这是一个统计学概念,用于分析多分类变量间的相互关系。以二维列联表为例,独立性假设意味着每个单元格的频率(πij)等于对应行的边际频率(πi)与列的边际频率(πj)的乘积。将这个关系取对数,我们得到:
log(πij) = log(πi) + log(πj)
进一步转换成频数形式,结合总体期望值(µij=nπij),我们有:
log(µij) = λ + λri + λcj
其中,λ是一个常数,λri和λcj分别代表行效应和列效应。通过拟合对数线性模型,可以估计这些效应的值。在马赛克图中,这些效应的估计值会表现为单元格的残差,这是评估模型拟合优度的关键。
残差通常有三种类型:似然比残差(G2)、Pearson χ2残差和Freeman-Tukey残差。似然比残差G2和Pearson χ2残差的定义如下:
G2 = 2 ∑(nij - µ̂ij) * log(nij / µ̂ij)
χ2 = ∑(nij - µ̂ij)^2 / µ̂ij
这些残差可以用来检测实际频数(nij)与预期频数(µ̂ij)之间的差异,从而评估列联表中不同类别组合的独立性。
此外,这段资料还提到了R语言在创建这类统计图形中的应用。R语言是一种广泛用于统计分析和绘图的编程语言,其丰富的图形包如ggplot2等,提供了创建复杂马赛克图的工具。通过R语言,用户可以轻松地生成马赛克图,以探索和展示高维数据集中的模式和关联。
最后,提到的"现代统计图形"部分是由谢益辉编写的,书中阐述了统计图形的重要性,并采用了Creative Commons许可协议,允许读者在遵循特定条件(如署名、非商业使用和相同方式共享)的情况下自由使用和分享内容。这种许可方式鼓励知识的开放共享,体现了R社区和自由软件的精神。
110 浏览量
2010-06-29 上传
2020-06-06 上传
2020-11-05 上传
2019-10-11 上传
2020-07-21 上传
2021-11-03 上传
2021-01-27 上传
137 浏览量
jiyulishang
- 粉丝: 26
- 资源: 3813
最新资源
- iirc:IRC服务器,如果我没记错的话
- Environment-Friend:一个旨在向大众传播废物管理意识的网站。 与与用户交互的聊天机器人集成
- bitbucket-companion-crx插件
- 笨蛋
- matlab二值化处理的代码-LAUCalTagWidget:BradAtcheson的CalTag摄像机校准方案的实时实施。这项工作得到了G
- 毕业设计&课设-基于MATLAB的FIR滤波器设计.zip
- 带C和Shell的操作系统:具有Shell和C编程的操作系统
- anti-csrf:功能齐全的反CSRF库
- pex:用于生成 .pex(Python EXecutable)文件的库和工具
- 盖斯玛斯
- Frogger_VG_Programming:一个Frogger克隆游戏机,用于练习为GAME 3150 05 SP2021进行编码@ Webster U
- ignite-challenge01
- 赫德梅塔卡普
- Check Adblocker-crx插件
- -COMP1521-计算机系统-基础知识:有关低级别系统内容的第一年课程
- 毕业设计&课设-该团队的直接模拟蒙特卡罗工作和模拟环境的脚本和数据。.zip