现代统计图形:ggplot2与lattice系统解析

需积分: 36 30 下载量 36 浏览量 更新于2024-08-09 收藏 4.68MB PDF 举报
"这篇文档是关于R语言中两种主要的绘图系统——lattice和ggplot2的介绍,由谢益辉撰写。文档探讨了lattice图形系统的设计理念,它是基于grid包,根据特定变量进行数据分解并绘制子集图形。接着介绍了ggplot2系统,该系统更加注重易用性和美学,结合了基础图形的简便和lattice的灵活性,基于"The Grammar of Graphics"的理论。文档还提到了ggplot2的创建者Wickham以及lattice的创始人Sarkar的工作。此外,文档的作者采用了Creative Commons许可,允许读者自由地获取和使用内容,但需遵循署名、非商业使用和相同方式共享的条件。" 在这篇文档中,我们了解到: 1. lattice图形系统:lattice是Sarkar开发的一套统计图形工具,基于grid包,其设计灵感来自Cleveland的Trellis图形概念。Trellis图形的核心思想是根据分类变量将数据划分为多个子集,并分别对每个子集进行绘图,类似于条件分析。这使得用户可以方便地观察不同分组间的差异。 2. ggplot2图形系统:ggplot2是Wickham为了提供更直观、更易于使用的统计图形而创建的。它结合了基础图形的简单性、grid和lattice的灵活性,并基于Wilkinson的"The Grammar of Graphics"理论。ggplot2通过构建图形语法,使得用户可以逐步添加层来构建复杂图形,使得绘图过程更加结构化和模块化。 3. The Grammar of Graphics:这是一本书,由Wilkinson撰写,提出了图形可以看作是一系列有序的数据操作和几何对象的组合,这一理论为ggplot2的设计提供了基础。ggplot2的语法使得用户可以清晰地定义数据、坐标系统、几何对象、统计变换和主题等元素,从而创建出清晰且具有洞察力的图形。 4. Creative Commons许可:文档的作者谢益辉选择了“署名—非商业性使用—相同方式共享2.5中国大陆”许可,这意味着读者可以免费获取和使用文档,但必须保留作者署名,不得用于商业目的,并且如果进行改编,新的作品也必须使用相同的许可条件。 5. 作者的考虑:谢益辉选择CC许可是为了促进知识的自由传播,同时也表达了对R语言社区的回馈。他不希望他的作品以不成熟的状态广泛传播,因此不建议以附件形式发布在论坛上,鼓励读者通过原始链接分享。 这篇文档提供了对R语言统计绘图的重要概述,特别是对于lattice和ggplot2这两个关键的绘图包的理解,同时强调了开放和分享的精神。对于R语言使用者,尤其是那些需要进行数据分析和可视化的人来说,这些知识是极其宝贵的。