SAS系统中七种主要的描述性统计程序解析

需积分: 49 165 下载量 138 浏览量 更新于2024-08-10 收藏 4.88MB PDF 举报
"本文档介绍了SAS系统内七种常用程序的使用,包括PROC MEANS、PROC SUMMARY、PROC UNIVARIATE、PROC CHART、PROC TABULATE、PROC CORR及PROC PLOT,这些程序主要用于执行描述性统计分析,提供样本的平均数、标准差、偏度、峰度等统计值,并能进行数据绘图和制表。通过对比各个程序的功能,帮助用户选择适合的工具进行数据分析。" SAS系统内的七种常用程序各自具有独特的功能和应用场景: 1. **PROC MEANS**:提供基础的统计量计算,如平均数、总和、标准差等,同时也处理遗漏数据和加权值的总和。 2. **PROC SUMMARY**:类似于PROC MEANS,但更侧重于提供总体统计信息,如四分位数、众数等,同时支持定制输出。 3. **PROC UNIVARIATE**:用于单变量的统计分析,除了基础统计量外,还包括偏度、峰度等分布特征,以及t检验和显著性。 4. **PROC CHART**:专注于数据的图表表示,如直方图、箱线图等,帮助用户直观理解数据分布。 5. **PROC TABULATE**:用于创建复杂的统计表格,可以跨多个变量进行数据的分类和汇总。 6. **PROC CORR**:计算变量间的相关性,包括皮尔逊积差相关、斯皮尔曼等级相关、肯德尔相关和霍夫丁D相关系数。 7. **PROC PLOT**:提供多样化的图形绘制功能,支持在同一报表上进行多图绘制。 了解这些程序的异同是至关重要的,因为它们在统计分析中扮演着不同的角色。例如,PROC MEANS和PROC SUMMARY在基础统计计算上相似,但在细节和定制化上有所不同。PROC UNIVARIATE则提供了更深入的分布分析。PROC CHART和PROC PLOT关注可视化,而PROC TABULATE专注于创建统计表格。PROC CORR则专门处理变量间的关系强度。 在实际工作中,根据需求选择合适的程序至关重要。比如,如果需要快速查看数据的中心趋势和分散程度,PROC MEANS或PROC SUMMARY可能是首选;若需要详细分析单变量的分布特性,则应使用PROC UNIVARIATE;若想展示数据的图形表示,PROC CHART和PROC PLOT是理想工具;如果关心变量之间的相关性,PROC CORR将是关键。通过熟悉这些程序,用户可以在SAS中更有效地进行数据探索和分析。

Casola, V., & Castiglione, A. (2020). Secure and Trustworthy Big Data Storage. Springer. Corriveau, D., Gerrish, B., & Wu, Z. (2020). End-to-end Encryption on the Server: The Why and the How. arXiv preprint arXiv:2010.01403. Dowsley, R., Nascimento, A. C. A., & Nita, D. M. (2021). Private database access using homomorphic encryption. Journal of Network and Computer Applications, 181, 103055. Hossain, M. A., Fotouhi, R., & Hasan, R. (2019). Towards a big data storage security framework for the cloud. In Proceedings of the 9th Annual Computing and Communication Workshop and Conference (CCWC), Las Vegas, USA (pp. 402-408). Rughani, R. (2019). Analysis of Security Issues and Their Solutions in Cloud Storage Environment. International Journal of Computer Trends and Technology (IJCTT), 67(6), 37-42. van Esbroeck, A. (2019). Zero-Knowledge Proofs in the Age of Cryptography: Preventing Fraud Without Compromising Privacy. Chicago-Kent Journal of Intellectual Property, 19, 374. Berman, L. (2021). Watch out for hidden cloud costs. CFO Dive. Retrieved from https://www.cfodive.com/news/watch-out-for-hidden-cloud-costs/603921/ Bradley, T. (2021). Cloud storage costs continue to trend downward. Forbes. Retrieved from https://www.forbes.com/sites/tonybradley/2021/08/27/cloud-storage-costs-continue-to-trend-downward/?sh=6f9d6ade7978 Cisco. (2019). Cost optimization in the multicloud. Cisco. Retrieved from https://www.cisco.com/c/dam/en/us/solutions/collateral/data-center-virtualization/cloud-cost-optimization/cost-optimization_in_multicloud.pdf IBM. (2020). Storage efficiency solutions. IBM. Retrieved from https://www.ibm.com/blogs/systems/storage-efficiency-solutions/ Microsoft Azure. (n.d.). Azure Blob storage tiers. Microsoft Azure. Retrieved from https://azure.microsoft.com/en-us/services/storage/blobs/#pricing Nawrocki, M. (2019). The benefits of a hybrid cloud strategy for businesses. DataCenterNews. Retrieved from https://datacenternews.asia/story/the-benefits-of-a-hybrid-cloud-strategy-for,请把这一段reference list改为标准哈佛格式

120 浏览量