没有合适的资源?快使用搜索试试~ 我知道了~
首页PMF正交矩阵因子分解
PMF正交矩阵因子分解
5星 · 超过95%的资源 需积分: 50 22 下载量 108 浏览量
更新于2023-05-21
评论 1
收藏 12.37MB PDF 举报
PMF正交矩阵因子分解 主要讲解EPA PMF软件的使用,是很好的中文使用文档说明,值得学习参考,对于大气环境数据的分析很有帮助。
资源详情
资源评论
资源推荐
PMF 是一个多变量因素分析工具,它把采样数据矩阵分解成两个矩阵:系
数的贡献( G)和因字数( F),这些因子情况需要用户利用测得的源配置文件信
息,以及排放或排放清单进行解释,以识别对样品有贡献的的源类型 。该方法
在这里简要回顾,在其他地方更详细地描述。
结果使用约束:没有样品可以有显著负贡献。 PMF 的使用样品的浓度和用
户提供的不确定度进行各个点加权。
此功能允许分析人员占信心在测量。 例如,检测限下面的数据可以被保留用于
该模型中, 与相关联的调整的不确定度, 以便这些数据点比测量高于检测限的数
据点,对解决方案有较小的影响。
因 子 贡 献 和 因 字 数 使 PMF 模 型 目 标 函 数 Q 最 小 化 。
Q 是 PMF 的一个关键参数,两个版本的 Q 显示在模型运行。 Q(真)计算
是包括所有点的拟合优度参数。 Q(鲁棒)是计算排除不符合模型的点(定义为
样品的量的不确定度残差大于 4)的拟合优度参数 。
Q(真)和 Q(鲁棒)的区别在于测试残差高的数据的影响。这些数据点可
能与来自源的峰值影响相关联
EPA PMF 需要底层多线性多次迭代( ME),以帮助识别最优化的因子贡献
和因字数。这是由于在 ME 算法的性质 ,用随机生成的因子数开始搜索因子配
置文件。这一因素配置文件使用梯度的方法来绘制的到最佳的解决方案的最优路
径。在空间方面, 该模型利用观察构建多维空间, 然后使用梯度的方法来遍历空
间 沿着这条道路找到最佳解决方案。 最佳的解决方案通常是由沿着路径的最低
Q(稳健)值(即最小 Q)所识别 ,可以被想象成一个槽的底部在一个多维的空
间中。由于起点的随机性(由种子值和它表示的路径来确定) ,不能保证该梯度
方法总能找到多维空间 (全球最低)的最深点 ; 它可能找到一个局部的最低水平。
为了最大限度地达到全局最小, 该模型应为一个开发的解决方案运行 20 次和 100
次对一个最终的解决方案,每次以不同的起点。
因为 Q(鲁棒) 不被那些没有被 PMF 拟合的点影响,它被用作一个关键参
数从多个运行选择最佳的运行。此外,可变性 Q(稳健)提供了一个指示(初
始运行结果是否有显著变化) ,因为用来启动梯度算法的随机种子在不同的位置 。
如果数据提供 稳定 的路径到最小, 则间 Q(可靠) 的值在 不同运行之间将会变化
很小 (判据)。在其他情况下,该起始点和由数据定义的空间的组合会影响到最
小值的路径,导致 Q(鲁棒)的值变化 ;最低 Q(健壮) 值默认使用,因为它代
表了最优化的解决方案。应当注意的是 Q 值的微小的变化并不一定表示该不同
的运行具有的小的差异在源成分之间。
由于化学成分变化或过程变化引起的变异可能会造成因子配置的显著差异
在 PMF 运行中。提供两个诊断去评估不同运行间的差异:内部运行残差分析和
物种分布的因素总结相比那些最低的 Q(稳健)运行。用户必须评估 PMF 中的
所有的错误估计去理解模型结果的稳定性 ;算法和 ME 输出 在 Paatero等人进行
了描述。 (2014年)。PMF 的解决方案的差异可以使用三种方法估计:
1、 自举(BS)分析用于确定是否有一个小的观察组可以不
成比例地影响解决方案 。BS 误差区间包括随机误差
和部分包括旋转歧义的影响。 旋转歧义是由 PMF 产生
的在许多方面相似的无限的解决方案引起。 也就是说,
对于任意一对矩阵,可以通过简单的旋转一对矩阵可
产生无限变化。只有一个源的贡献非负的约束,不可
能限制这个空间旋转。 BS 错误估计通常是坚固的和不
被用户指定的样品的不确定度影响。
2、 替换( DISP)是一种分析方法,它可以帮助用户
了解解决方案的更详细的细节,包括其对微小变化的
敏感性。 DISP 误差区间包括旋转歧义的影响,但不包
括数据中的随机误差的影响。 数据的不确定度 将直接
影响 DISP 误差估计。 因此,向下加权的物种的误差区
间很可能大
3、 BS-DISP(混合方式)的误差区间包括随机误差和
旋转歧义的影响。 BS-DISP 结果比 DISP 结果更加可
靠,因为 BS-DISP 的 DISP 相不像 DISP 本身那样强烈
的置换。
这些方法在三个空气污染数据集中被应用在 Brown 等人。(2014
年)。本文提供了基于环保局误差估计应用的解释。 Paatero等人(2014)
和布朗等人( 2014 年)文献是美国环保署的 PMF 的重要参考,两者
都提供了错误估计的详细信息和他们的解释, 这只简要介绍在本指南
中。
1.2 多线性发动机
如上所述,两种常见的方案解决了 PMF 的问题,最初, PMF2
解决方案( Paatero,1997)被使用。在 PMF2,非负约束可能被加在
因子元素和最小二乘拟合时, 测量将会被单独进行基于不确定度。 有
了这些功能, PMF2 是环境数据的受体模型的显著改进对以前的主成
分分析( PCA)技术。然而, PMF2 是有局限的,因为它被设计来解
决一个非常具体的 PMF 问题。在 20 世纪 90 年代后期, ME,一个更
灵活的方案,开发出来( Paatero,1999)。这个方案,目前在它的第
二个版本,并称为 ME-2 中,包括与 PMF2 许多相同的特征(例如,
用户能够进行单独的加权测量,并提供非负约束条件) ;然而,不像
PMF2,ME-2 的结构使得它可以用来解决各种多线性问题, 包括双线
性,三线性和混合模型
ME-2 是通过将两个单独的步骤结合来解决 PMF 问题。首先,用
户定义感兴趣的 PMF 模型的表。然后,一个自动化的二次程序读取
表格模型参数,并计算该解决方案。当采用 EPA PMF 解决 PMF 问
题,第一步是通过由所述 EPA PMF 的用户界面产生的输入文件取得。
一旦指定了模型,数据和用户规格由 EPA PMF 送入二次 ME-2 程序。
ME-2 解决了 PMF 的迭代公式, 最小化求和 -平方对象函数, Q,通
过一系列的步骤,如图 1。 一个稳定的解决方案已经达到,当额外
的迭代用来降低提供的 Q 值递减。通过以上三个层次的迭代, 寻求解
决方案从粗到细规模。迭代的第一级识别空间解决方案的整体区域。
在这个水平 上,Q 的变化( DQ)需要小于 0.1 超过 20 个连续的
步骤且不到 800 步。第二个水平识别的最终解决方案的附近。这里,
dQ 的要求小于 0.005 超过 50 个连续的步骤且不到 2000 的步骤。第三
级收敛到最佳的 Q 值(Paatero,2000),其中 dQ 的应该小于 0.0003
超过 100 个连续的步骤且小于 5000 的步骤。
ME-2 通常需要小数据集(小于 300 的观察)的几百次迭代和高
达 2000 对于大型数据集( Paatero,2000)。如果没有找到一个解决方
案,满足三个层次任何一个的要求,那么解决方案是不收敛的
(Paatero,2000 年)。从 ME-2 的输出由 EPA PMF 读取,然后格式化
由用户解释。 此外, EPA PMF 具有通过 ME-2 和 EPA PMF 实现的三
个错误估计方法。
ME-2 和 PMF2 模型的结果之间的差异已通过相同的数据集各模
型的,其结果的比较应用研究在几个研究中。总的来说,这些研究显
示了主要成分的相似的结果,但在 PMF2 溶液中的更大的不确定度
(斋戒等人,2003),并使用 ME-2 更好。盲源分离(Kim 等人,2007)。
在最近的两个出版物,要素配置文件限制由 ME-2 的应用导致了发现
的来源数量较多(阿马托等人, 2009;阿马托和 Hopke,2012)。EPA
PMF5 版本采用了最新版本的 ME-2 和 PMF 的脚本文件,该文件 通
过 Pentti Paatero在赫尔辛基和雪莱埃伯利大学几何被开发 工具
(2014 年 3 月 3
日;me2gfP4_1345c4.exePMF_bs_6f8xx_sealed_GUI.ini)
2 PMF 的使用
PMF 已应用于多种范围的数据,包括 24 小时分辨率的 PM 2.5
数据,气溶胶粒度分辨,沉降物,有毒气体,高时间分辨率的测量,
从气溶胶谱仪( AMS )得到的和挥发性有机化合物( VOC)的数据。
参考部分(第 9 部分)提供了 PMF 引用的众多参考。关于 PMF 应用
的更多讨论可在多元受体建模工作簿中见到( Brown 等, 2007)。我
们鼓励用户阅读与他们的数据有关的论文以及源解析论文。 用于 PMF
分析的方法已经改变了,例如限制已提供。重要引用总结于表 1 中。
PMF 需要一个数据集通过多个样品检测得到的一组参数。 例如,
PMF 常用于 100 个样品以上包含 10? 20 个物种的 PM2.5 数据集。不确定度数
据集,分配了每个种类和样品的不确定度值。不确定度计算使用以往的不确定
度或其他可用信息例如采样精度。
3、 PMF5.0 安装
4、特点
通过 PMF5.0 可获得以下特征
1 整理数据 列在表中可以通过左键点击列标题进行排序。点击一次
会以递增顺序对项目进行排序, 点击两次将降序排序。 如果列已排序,
箭头会出现在标题显示在它的排序方向
2 保存图像
所有图形输出可以通过右键单击图像以各种格式保存。可用的格式
是.GIF 及.BMP,.png 和.TIFF。在同一个菜单中,用户可以选择复印
或打印图形。 一种堆叠图形选项也可以把因子或者时间序列结合在一
个页面。当 “复制”时,图形将被复制到剪贴板。在 “打印 ”时,图形将
自动发送到本地机器上的默认打印机。 当保存一个图形, 会出现一个
对话框,以便用户可以改变文件的路径和文件的输出文件的名称
剩余103页未读,继续阅读
Together_CZ
- 粉丝: 10w+
- 资源: 59
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论5