SAS PROC Tabulate教程:基本用法与统计量控制

需积分: 43 8 下载量 111 浏览量 更新于2024-09-12 收藏 62KB DOC 举报
"PROC Tabulate 是 SAS 中用于创建统计表格的程序,主要用于数据的分类和汇总。这个过程允许用户按照指定的变量进行分组,并计算各种统计量,如均值、最大值、最小值等。本文将对 PROC Tabulate 的基本用法进行总结,包括变量的分类、表格结构以及输出格式的控制。" PROC Tabulate 的核心在于 `class` 和 `table` 语句。`class` 语句用于指定分类变量,可以包含数值型和字符型变量,而 `table` 语句则定义了表格的布局。在 `table` 中,变量的位置决定了它们在输出表格中的行列位置。例如,`table port, locomotion;` 将创建一个以 `port` 为行,`locomotion` 为列的表格。 `var` 语句用于指定需要进行统计的数值型变量,其统计结果通常为总和。需要注意的是,`var` 不能包含字符型变量。`class` 中的变量则会统计出现的次数。 PROC Tabulate 支持多种表格形式。例如: 1. `table portlocomotion;` 会为每个 `type` 类别创建一个单独的表格。 2. `table port, locomotion;` 将 `port` 作为行变量,`locomotion` 作为列变量,表格个数由 `port` 的类别决定。 3. `table port*locomotion;` 将 `port` 和 `locomotion` 结合在同一张表中,形成交叉表。 在 `table` 后面可以添加统计量,如 `mean`, `max`, `min`, `sum`, `pct`, `n` 等,以计算相应变量的统计信息。例如,`mean*price` 表示计算 `price` 的平均值,而 `type all` 则是对 `type` 变量的所有观察值进行计数。 控制 PROC Tabulate 输出格式的关键在于 `format`、`box` 和 `misstext`。`format` 用于设定数据的显示格式,`box` 用于在左上角添加文本,`misstext` 则用于指定缺失值的显示文本。通过这些选项,用户可以自定义表格的视觉呈现,使其更加清晰易读。 举例来说,`PROC Tabulate format=dollar9.2;` 会将所有数据格式化为带有两位小数的美元格式。如果需要针对不同变量设定不同的格式,可以在 `table` 语句中分别指定。 PROC Tabulate 是 SAS 中强大的数据分析工具,能够帮助用户有效地组织和展示数据,进行多维分析,并通过自定义格式来提升报告的可读性。通过对 `class`、`table`、`var` 以及各种格式控制选项的灵活运用,用户可以创建满足特定需求的统计表格。
2014-03-17 上传