PMF模型误差估计与可靠性数据分析

需积分: 50 78 下载量 23 浏览量 更新于2024-08-08 收藏 9.58MB PDF 举报
"基本模型替代误差估计-可靠性数据分析教程" 在PMF(Positive Matrix Factorization,正交矩阵因子分解)源解析模型中,该教程聚焦于基本模型替代误差估计方法,这是评估PMF解决方案的一种策略,特别是针对源配置文件的旋转歧义。DISP(Discrepancy)误差估计技术被用来确定解决方案的不确定性,而不会显著增加Q值。Q值是PMF模型中的关键参数,代表模型拟合优度,分为Q(真)和Q(鲁棒)两个版本。Q(真)考虑所有数据点,而Q(鲁棒)则排除那些残差超出四倍不确定度的数据点,以降低异常值的影响。 DISP误差估计可以独立于BS(Bootstrap)运行,也可以在BS和BS-DISP之后运行,分别在5.8和5.9部分详述。在用户选择的解决方案下,因子信息的每个值首先上下调整一次,然后计算所有其他值以达到关联的PMF并找到最小Q值。值得注意的是,这个新计算的最小Q值(修改后)可能与未经调整的解决方案(基础值)的Q值不同。 在调整因子信息值时,最大允许的差异(DQ=基 - 修改)受到dQmax的约束,dQmax是预先设定的最大差值。模型会为每个dQMax值(如4、8、15、25)生成结果,展示在各因子中每个元素的DISP执行和源信息值的区间(最小和最大值)。例如,如果有20种元素在一个数据集中,且采用7个因子模型,DISP方法将为每个dQMax值估计140个间隔。 模拟研究表明,dQ值为4和8通常提供最小的误差范围,并且导致最少的基底因子值超出范围。EPA的PMF应用中,所有dQmax值都会被考虑。PMF模型通过最小化目标函数Q,结合样品浓度和用户提供的不确定度权重,确保无显著负贡献的样品。因子贡献和因字数的优化是通过多线性多次迭代(ME)算法实现的,该算法从随机起点寻找最优解。尽管梯度方法可能找到局部而非全局最小值,但通过多次运行(如20次和100次)可以提高找到全局最小解的概率。选择最佳运行的标准是Q(鲁棒)的稳定性,其变化小意味着解决方案更可靠。在数据定义的空间和起点的组合导致最小Q(鲁棒)路径变化时,这种变化提供了对模型稳定性的指示。