鉴别法与集群法在分类中的应用差异

需积分: 49 165 下载量 172 浏览量 更新于2024-08-10 收藏 4.88MB PDF 举报
"鉴别法与集群法的异同分析,以及SAS中的鉴别分析程序" 鉴别法和集群法是两种在统计学中用于分类的方法,但它们有着本质的区别。鉴别法是一种有监督的学习方法,它基于已知的类别信息对新样本进行分类。例如,在生物学研究中,如果已知某些植物属于草本类或木本类,鉴别法可以找到最佳的特征组合,以区分这两类植物。在SAS中,鉴别分析可以通过PROC DISCRIM、PROC CANDISC和PROC STEPDISC三个程序实现。 PROC DISCRIM主要用于分类鉴别分析,可以将观察体分配到预定义的类别中。该程序提供了参数和非参数两种鉴别方法,前者假设数据来自多元正态分布,后者则与旧版的NEIGHBOR程序类似,适用于非参数分析。 PROC CANDISC执行典型鉴别分析,其方法与主成分分析和典型相关分析相关,旨在找到一个线性组合来突出类别间的差异,而非进行直接的分类。 PROC STEPDISC则用于逐步鉴别分析,通过逐步回归的方式选择最优的变量组合,以最大化类别间的区分度。 相反,集群法(见第九部分)是一种无监督学习方法,不依赖预先设定的类别。它根据观察体的属性相似性自发地构建类别。在集群法中,数据集中的个体被分配到最接近它们的群组,而这些群组(或“集群”)是在分析过程中自然形成的。因此,鉴别法和集群法虽然都涉及分类,但它们的分类原理和应用场景有所不同。 在SAS系统中,描述性统计分析也是非常重要的一部分,包括PROC MEANS、PROCSUMMARY、PROC UNIVARIATE、PROC CHART、PROCTABULATE、PROCCORR、PROCPLOT等程序,分别用于计算统计量、生成图表、绘制直方图、制作表格、计算相关性和生成图形等。这些工具为数据分析师提供了全面的数据探索和解释能力。 总结起来,鉴别法和集群法都是统计分类技术,但鉴别法依赖已知类别信息,而集群法则探索数据自身的结构形成类别。SAS提供了一系列的程序来支持这两种方法以及其他统计分析,使用户能够高效地处理和理解他们的数据。

Casola, V., & Castiglione, A. (2020). Secure and Trustworthy Big Data Storage. Springer. Corriveau, D., Gerrish, B., & Wu, Z. (2020). End-to-end Encryption on the Server: The Why and the How. arXiv preprint arXiv:2010.01403. Dowsley, R., Nascimento, A. C. A., & Nita, D. M. (2021). Private database access using homomorphic encryption. Journal of Network and Computer Applications, 181, 103055. Hossain, M. A., Fotouhi, R., & Hasan, R. (2019). Towards a big data storage security framework for the cloud. In Proceedings of the 9th Annual Computing and Communication Workshop and Conference (CCWC), Las Vegas, USA (pp. 402-408). Rughani, R. (2019). Analysis of Security Issues and Their Solutions in Cloud Storage Environment. International Journal of Computer Trends and Technology (IJCTT), 67(6), 37-42. van Esbroeck, A. (2019). Zero-Knowledge Proofs in the Age of Cryptography: Preventing Fraud Without Compromising Privacy. Chicago-Kent Journal of Intellectual Property, 19, 374. Berman, L. (2021). Watch out for hidden cloud costs. CFO Dive. Retrieved from https://www.cfodive.com/news/watch-out-for-hidden-cloud-costs/603921/ Bradley, T. (2021). Cloud storage costs continue to trend downward. Forbes. Retrieved from https://www.forbes.com/sites/tonybradley/2021/08/27/cloud-storage-costs-continue-to-trend-downward/?sh=6f9d6ade7978 Cisco. (2019). Cost optimization in the multicloud. Cisco. Retrieved from https://www.cisco.com/c/dam/en/us/solutions/collateral/data-center-virtualization/cloud-cost-optimization/cost-optimization_in_multicloud.pdf IBM. (2020). Storage efficiency solutions. IBM. Retrieved from https://www.ibm.com/blogs/systems/storage-efficiency-solutions/ Microsoft Azure. (n.d.). Azure Blob storage tiers. Microsoft Azure. Retrieved from https://azure.microsoft.com/en-us/services/storage/blobs/#pricing Nawrocki, M. (2019). The benefits of a hybrid cloud strategy for businesses. DataCenterNews. Retrieved from https://datacenternews.asia/story/the-benefits-of-a-hybrid-cloud-strategy-for,请把这一段reference list改为标准哈佛格式

2023-05-29 上传