酿酒葡萄与葡萄酒理化指标的典型相关分析

需积分: 33 28 下载量 153 浏览量 更新于2024-08-10 收藏 1.39MB PDF 举报
"问题三的模型建立与求解-probabilistic programming and bayesian methods for hackers读书笔记" 这篇读书笔记详细介绍了如何使用典型相关分析来研究酿酒葡萄与葡萄酒的理化指标之间的联系。典型相关分析是一种统计方法,旨在寻找两组变量间的最大相关性。在这个案例中,酿酒葡萄的理化指标作为输入变量,葡萄酒的理化指标作为输出变量。 步骤一,建立原始矩阵。根据数据,创建一个包含酿酒葡萄和葡萄酒理化指标的总体中心化观测数据阵Z。 步骤二,对原始数据进行标准化变换和计算相关系数矩阵。这一步通过标准化处理数据,计算出酿酒葡萄和葡萄酒之间的相关系数矩阵R,进一步分为内部相关系数阵和相互之间的相关系数阵。 步骤三,求解典型相关系数和典型变量。通过对相关系数阵执行特征分解,找出特征根和特征向量,以此确定典型相关系数和典型变量。典型变量V和W代表了酿酒葡萄和葡萄酒理化指标的新表示,它们最大化了两者之间的线性相关性。 步骤四,检验典型相关系数的显著性。这一步确保我们得到的关联并非偶然,而是具有统计意义的。 在问题三的分析中,发现了几个关键点: 1. 酿酒葡萄果皮含量与葡萄酒中DPPH半抑制体积含量正相关,影响抗氧化性能。 2. 苹果酸在发酵和保护红葡萄酒颜色(花色苷和单宁)方面起重要作用。 3. 葡萄总黄酮和总酚的协同作用有助于转化DPPH自由基,影响葡萄酒的抗氧化能力。 问题四中,通过剔除可被葡萄酒指标间接表示的酿酒葡萄指标,建立了多元线性回归模型,进一步探讨了这些理化指标对葡萄酒质量的具体影响。经过显著性差异检验,证明了利用理化指标评估葡萄酒质量的合理性。 整个研究过程综合运用了多种统计方法,如K-S检验、Wilcoxon符号秩检验、肯德尔和谐系数、主成分分析、典型相关分析和多元线性回归,展示了在数据分析和质量评价中的多样性和深度。此外,借助MATLAB、SPSS、SAS和EXCEL等软件工具,实现了模型的建立和验证,提供了对葡萄酒质量评价的全面视角。