AGK法与椭圆形集群分析:一种改进的统计方法

需积分: 49 165 下载量 94 浏览量 更新于2024-08-10 收藏 4.88MB PDF 举报
在2020年至2040年的技术趋势报告中,特别关注了对集群分析的贡献。传统的集群分析方法,如Everitt (1980)所述,通常假设数据簇呈现为几何形态,如球形,这在处理非球形的椭圆形集群时存在局限性。为了解决这个问题,Art Gnanadesikan和Kettenring在1982年提出了共变异数近似估计值的集群分析法(AGK法),这种方法允许在不预先知道集群数量和大小的情况下,通过线性转换将非球形的共变异数矩阵转换为可以处理的球形形式。这种转换使得距离测量变得可行,尽管实施起来挑战重重,因为它依赖于对所有集群形状的共同近似假设。 AGK法的关键在于估算共变异数,这是一种统计手段,用于衡量不同变量之间的变异程度。在SAS(SAS System,一种强大的统计分析软件)中,章节内容围绕着如何利用SAS系统的多种统计程序进行描述性数据分析,包括但不限于: 1. PROCMEANS: 用于生成单变量的统计摘要,提供数据的中心趋势、离散程度等信息。 2. PROCUNIVARIATE: 用于计算和绘制单变量的统计图形,如直方图、频率分布等。 3. PROCCHART: 主要用于创建质量控制图表,用于监控过程的稳定性。 4. PROCTABULATE: 制作统计表格,展示数据的汇总信息。 5. PROCCORR: 测量变量间的关系强度,通过相关系数进行分析。 6. PROCPLOT: 能绘制多种图形,支持在同一报表上进行多变量的可视化。 7. PROCSTANDARD: 进行标准化分数处理,使数据具有可比性。 8. PROCRANK: 实现排名或排序操作,适用于需要对数据进行等级划分的情况。 9. PROCSCORE: 计算变量值的线性组合,常用于数据分析中的合成变量。 这些程序都是SAS系统的重要组成部分,能够帮助用户有效地处理各种统计分析任务,尤其是在处理复杂的数据集和非标准形态的集群分析时。然而,每种程序的使用都需要明确的目标和适当的步骤,如编写合适的程序代码、理解输出结果以及考虑可能的注意事项,以便正确解读和应用分析结果。

Casola, V., & Castiglione, A. (2020). Secure and Trustworthy Big Data Storage. Springer. Corriveau, D., Gerrish, B., & Wu, Z. (2020). End-to-end Encryption on the Server: The Why and the How. arXiv preprint arXiv:2010.01403. Dowsley, R., Nascimento, A. C. A., & Nita, D. M. (2021). Private database access using homomorphic encryption. Journal of Network and Computer Applications, 181, 103055. Hossain, M. A., Fotouhi, R., & Hasan, R. (2019). Towards a big data storage security framework for the cloud. In Proceedings of the 9th Annual Computing and Communication Workshop and Conference (CCWC), Las Vegas, USA (pp. 402-408). Rughani, R. (2019). Analysis of Security Issues and Their Solutions in Cloud Storage Environment. International Journal of Computer Trends and Technology (IJCTT), 67(6), 37-42. van Esbroeck, A. (2019). Zero-Knowledge Proofs in the Age of Cryptography: Preventing Fraud Without Compromising Privacy. Chicago-Kent Journal of Intellectual Property, 19, 374. Berman, L. (2021). Watch out for hidden cloud costs. CFO Dive. Retrieved from https://www.cfodive.com/news/watch-out-for-hidden-cloud-costs/603921/ Bradley, T. (2021). Cloud storage costs continue to trend downward. Forbes. Retrieved from https://www.forbes.com/sites/tonybradley/2021/08/27/cloud-storage-costs-continue-to-trend-downward/?sh=6f9d6ade7978 Cisco. (2019). Cost optimization in the multicloud. Cisco. Retrieved from https://www.cisco.com/c/dam/en/us/solutions/collateral/data-center-virtualization/cloud-cost-optimization/cost-optimization_in_multicloud.pdf IBM. (2020). Storage efficiency solutions. IBM. Retrieved from https://www.ibm.com/blogs/systems/storage-efficiency-solutions/ Microsoft Azure. (n.d.). Azure Blob storage tiers. Microsoft Azure. Retrieved from https://azure.microsoft.com/en-us/services/storage/blobs/#pricing Nawrocki, M. (2019). The benefits of a hybrid cloud strategy for businesses. DataCenterNews. Retrieved from https://datacenternews.asia/story/the-benefits-of-a-hybrid-cloud-strategy-for,请把这一段reference list改为标准哈佛格式

120 浏览量