没有合适的资源?快使用搜索试试~ 我知道了~
⃝−⃝可在www.sciencedirect.com在线ScienceDirectICT Express 5(2019)120www.elsevier.com/locate/icte删失和丢弃数据下GMM参数估计的EM算法及其在室内定位Trung Kien Vua, Manh Kha Hoanga,Hung Lan Leba越南河内工业大学电子工程技术学院b越南河内接收日期:2018年7月7日;接受日期:2018年2018年9月4日在线发布摘要本文提出了一种基于Wi-Fi指纹的室内定位系统(WF-IPS)中的特定类型的不完整数据:删失和丢弃的混合数据。为了拟合这类数据,提出了删失丢弃高斯混合模型(CD-GMM)。此外,本发明还 开发了期望最大化(EM)算法的扩展版本以用于估计该模型的参数。仿真结果表明,我们的建议相比,现有的方法的优势因此,这种方法不仅具有潜力的WF-IPS,但也为其他应用。c2018 韩 国 通 信 与 信 息 科 学 研 究 所 ( KICS ) 。 Elsevier B. V. 的 出 版 服 务 。 这 是 CC BY-NC-ND 许 可 证 下 的 开 放 获 取 文 章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:1. 导言(10p)由于在许多公共区域中存在无线局域网(WLAN),因此依赖于Wi-Fi信号的室内定位的解决方案特别令人感兴趣。智能手机是常见的个人便携式设备,通常配备有Wi-Fi传感器,因此,实现室内定位系统仅仅是软件的问题。最流行的WLAN定位方法是利用RSSI;其中,基于指纹的方法最适合复杂的室内环境,因为发射机和接收机之间不需要视线[1]。基于指纹的方法包括两个阶段:训练阶段和分类(在线定位)阶段。在训练阶段,从Wi-Fi接入点(AP)在参考点(RP)处收集训练数据(RSS的值),并用于构建所谓的无线电地图。在在线阶段,*通讯作者。电子邮件地址:www.example.comkien.vu @ haui.edu.vn(T.K.Vu),khahoang@haui.edu.vn(M.K. Hoang),lanlh1960@yahoo.com(H.L. Le)。同行评审由韩国通信和信息科学研究所(KICS)负责https://doi.org/10.1016/j.icte.2018.08.001通过计算在线观测与无线电地图之间的相似性来获得估计位置。因此,定位结果的精度高度依赖于估计参数的精度。有两种常见的类别用于建模RSS值的分布:参数模型和非参数模型。如[2]所述,采用参数模型的系统优于非参数模型。在我们的工作中,我们注意到在[3- 6 ]中报告的测量的Wi-Fi RSS数据中存在在[3,4]中,作者已经认识到观测数据中的删失和丢弃问题。虽然由于Wi-Fi芯片组的灵敏度有限(典型智能手机约为100 dBm),因此审查问题很明显丢弃意味着AP的RSS测量偶尔不可用,尽管它们的值明显高于审查阈值。掉线可能是由于设备的意外操作或AP出于节能目的而暂时关闭状态等原因。2405-9595/c2018韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。====[()]{==n= 1 j=1∫()∑( )J[客户端]参数集,θj=()∑ ∑µj,σj的参数集,NJT.K. Vu,M.K. Hoang和H.L. Le / ICT Express 5(2019)120-123121在[5,6]中,GMM用于对观察到的RSS数据进行建模。原因是周围环境的变化,例如门的关闭/打开和用户的方向,会明显改变测量的信号强度。然而,[5,6]中的作者在他们的工作中没有考虑删失和丢弃问题。这促使我们提出了一种新的方法:通过CD-GMM对观测数据进行建模,以便能够考虑到所有讨论的问题。此外,为了估计这样的模型的参数,开发了EM算法,该EM算法是在[4,7,8]中提出的EM算法的扩展版本。本文将文献[4]提出的EM算法推广到删失和丢弃的单高斯数据。在文献[7,8]中,这两个工作都能有效地处理截尾和截断问题引起的参数估计偏差,但没有考虑与截尾和截断数据不同的丢弃数据。本文共分四个部分。第一部分是绪论。在第2节中,引入CD-GMM来建模RSS分布,并推导出EM算法的参数估计。第三部分是对所提出的方法的有效性的评价。本文在第4节中结束。2. 提出方法Fig. 1. 删失和丢弃数据下的测量模型。由于丢弃问题,在李克里-胡德计算中引入了d,完全数据是no w(y,d,d),因此,(1)成为2.1. CD-GMM对RSS测量的建模N J设y=[y1,y2,. . . ,yN];yn∈R;n=1<$N是p(y),y,d|Θn)=θn[wjp(yn,dn|θj)]nj。(二)n= 1 j=1一组不可观察、未删失、未丢弃的数据(完整数据),N是测量次数,yn是独立同分布的随机变量。让d[d1,. . . .. not(dn 0);c是Wi-Fi传感器在 移动目标。设x[x 1,. . . .. 1),yn,如果yn> c且dn0c,否则测量模型如图所示。1.一、2.2. CD-GMM的EM算法对数概率是ln[p(y),n,d]|Θn)]=∑nn j{ln(wj)+ln p y n,d n|θj。(三)E-步骤:由于隐藏变量是不可观察的,因此不是直接计算对数似然,而是计算观察值x和先前估计参数的完整数据(y,y,d)的对数似然的期望值Q(Θn,Θn(k))=E{ln[p(yn,yn,dn)}|θ)]<$x<$;θ(k)}NJ1在GMM中,ygivenθ的li k函数为:=∑ ∑∑+∞nj−∞{ln(wj)N J n=1j= 1dn=0py⃗|θ=wjpyn|θj。(一)n= 1 j= 1+ln [p(yn,dn; θj)]} p(θnj,yn,dn|xn; Θ(k))dyn.由方程式(1),Θi=[w1,[. . . ,w]J;μ1,. . . ,μJ;σ1,. . . ,σJ]是由方程式在等式(4)中,Θe(k)表示当前估计参数。令m=(z,. . . ,z是一组隐藏的二进制变量,第j个分量(j=1<$J),J是分量数,wj1 N是正的混合权重,其总和为1。11···.其中zn=0,当第n次测量可观察时(xn=yn)并且当第n个测量不可观测时,zn = 1(xn= c)。N1···中国北京(四){让=........是潜在变量的集合,那么,(4)可以写成Xnnj=1,当y n属于第j个分量0时,否则。Qθ,θ(k) =[(1−zn)Q1+znQ2+znQ3]。(五)n= 1 j= 1−JJ···==-JJxn;Θjln WJ+ln( 1−1)+ lnN xn;θjθ(ky,θerfc--J2σ(k)(k)Jy2Ny,θJ==−−⃗122T.K. Vu,M.K.Hoang和H.L.Le/ICT Express 5(2019)120在这里,(Q1=γj(k))()下一页[()]表1参数KL的平均值。cµ1σ1方法1=Q2=βj(Θ(k))[ 1−α(Θ(k),θ(k))]{[ ln(wj)0.075 0.15 0.225}(C(k))[5] 0.0018 0.0288 0.4317 1.1377 3.9022ln 1−]ln[(x;)]Nyn;θjdy;2019年12月28日星期一上午10时30分+()NnθjI((k))n2009 - 2009两年期拟议−∞0θjQ 3= w(k)α(Θ(k),θ(k))[ln(wj)+ln(k)].[5] 0.0329 0.2650 0.7725 1.6687 5.44761 [8] 0.0009 0.0052 0.0133 0.02722009 - 2009两年期拟议预算在本文中,我们使用符号P(dn1)因为丢弃率P(dn1)是指变量dn等于1的概率;N()是由θ参数化的高斯概率密度函数,[5] 3.1491 3.2325 3.3142 3.5054 6.1253() c()第一个0J=N1(c−µ(k))I((k))=Δcy(y(k))dy1θj−∞(k)N((k),θj) 1(k)(c−µ(k))2J可以看出,在方程Eqs。(6)=µj I0θj() C(I2−∞θ =-<$2πσjexp<$−)Jdy<$2σ(k)<$;数据,但也审查和丢弃的数据有助于估算此外,当收集的RSS值完成时,数据,即C =−∞和∞ =0,这些公式减少=[(σ2)(k)+(μ2)( k)]I(θ)丢弃的数据,通过设置w1= 1,[w2,. . . ,wJ]=[0,. . . ,0],J1(k)J(k)0j(c−µ(k))2上述公式简化为[4]中所报道的公式这就是为什么我们的所提出的方法能够考虑如第1节中所讨论的Wi-Fi RSS数据中的所有问题。-π2πσjµjexp−() w(k)N(xn;θ(k))Θ<$2σ(k)<$;3. 模拟结果和讨论在这个模拟中,我们完成了GMM下面的数据γjxn;(k)JJ=∑JJ(k)((k));使用一组参数(真实参数)生成:i= 1w i N(J;dy=;−∞2J−与传统的高斯混合模型EM算法相比,当观测数据服从单一高斯分布时,0[八]《中国日报》0.00110.01640.04360.06290.1898提出0.00920.01110.02290.03340.0364[五]《中国日报》5.63585.65055.78787.47737.61721[八]《中国日报》0.00120.02490.04610.14720.2053提出0.01240.02110.03890.04430.0947[五]《中国日报》7.28477.34247.36498.01638.7835=;=Θ()下一页()∑Jkk()()<$+1−<$===) w(k)I0(θ(k))xn;θiN1000 J2 [w1,w2][0. 五,零。五、 [σ1,σ2][3、 4] [µ1,µ2][ 八十岁,90]。 可观测数据x是删失,可能丢弃的数据。进行绩效(k)JJJ=∑J(k)J((k));的建议EM算法CD-GMM,我们改变了删失阈值c和丢弃率ε。采用Montei = 1wi I0θi(k)Carlo抽样方法[9],经过1000次模拟,Kullback Leibler(KL)真参数与α Θ(k),α θ(k)=α θi= 1M步:01 -02-03-02.(k)我作者提出的估计参数见表1。注意第一栏(100),KL采用[8]提出的估计量的发散结果是比我们的建议更好这可以解释如下:通过比较,得到了参数的重新估计公式。求出(5)w.r.t. 的元素我们把它们设为零,就得到了方程:(6)(9)见方框一。 EM算法运行于E步和M步交替进行直到收敛,即,直到对数似然的改进小于阈值。在收敛之后,我们估计参数:µ(k+1)µ(k):=µ;σ(k+1)σ(k):=σ;这个模拟,样本数量不够大(N 1000),因此,通过以下公式计算的估计丢弃率当量(9)不太接近零。因此,我们的建议提出了一个稍微差的估计的手段,标准偏差和加权因子。然而一旦出现掉落问题(100. 75 0. (3)我们的建议EM算法产生最好的结果之间考虑算法我θβ)J(k+1)J(k)JJ (k+ 1)JJ(k)ˆ此外,一组参数:J=2; [w1,w2]=[0。五,零。5];[σ1,σ2]= 3, 4; [µ1,µ2]=[−80,−90];c=wjwj:=wj;jj:=。−9 0;=0。15W,用于生成人工数据。的=Mm=1µ=(J+1)∑Nn=1(1 − z)γ x; Θx + β Θ1 −α Θ,(((k)J)((k)nJNnJJ)(1 − z)γx; Θ+ β Θ1 −α Θ,[( ()下一页k() K )]Iθ∑1Iθ()下一页(k)()下一页JN(k)n= 1zn∑Nn=1nJN((k)J)J()下一页0J(k)J[((k)( k))]∑Nn=1.(六)zn()下一页σ2J(k+1)=n= 1∑Nn=1(1−z)∑N((1−z)nJN(k))()γx;Θ(x−µ)((k))J(K)nJNγx; Θ+ βΘ1 −α Θ,)n j2JJJ(((k)(k))]∑Nn=1znβj Θ()+(())∑N()[K1 −α Θ,( ()下一页k() K )]我θ(k)2JI0θ(k)()下一页−2µjI1(θ(k))JIθ0()下一页(k)jn= 1+µ 2 ∑Nznn=1(1−z)nJNγx;(Θ+ βΘ1 −α Θ,(k)J)()J J(k)JJ((k)(k) )]∑N.(七)n=1znw=(J+1)N1(1−z)γx;Θ((k)jj jn=){()βΘ1 −α Θ,θ+α Θ,(k)((k))(k )n=nJNJ)]((k)(k))W(k)N} ∑1 znN+N.(八)=(+1)nα Θ,( (k)(k)N)∑N=1个zn .(九)T.K. Vu,M.K. Hoang和H.L. Le / ICT Express 5(2019)120-123123方框一相位已经减小,并且因此,WF-IPS的定位结果可以得到显著改善此外,这种方法可以在其他应用中用作估计器。利益冲突作者声明,本文中不存在利益冲突引用图二.估计参数w.r.t.测量次数N。测量次数N从102变为105。估计值的均方误差(MSE)参数即,M SE(µm1)=1∑M(µ1−µ1)2和数[1] L.迈内蒂湖帕特罗诺岛Sergi,室内定位系统的调查,在Prod。第22届软件、电信和计算机网络国际会议(SoftCOM),2014年。[2] K. Kaemarungsi,P.Krishnamurth,基于位置指纹的室内定位系统建模,见:INFOCOM会议记录,香港,2004年3月。[3] K.黄河Haeb-Umbach,应用于Wi-Fi室内定位的删失高斯数据的参数估计和分类,在:IEEE声学,语音和信号处理国际会议(ICASSP)会议记录,温哥华,2013年5月。[4] K. Hoang , J. 施 马 伦斯 特 罗 埃河 Haeb-Umbach , Aligning trainingmodels with smartphone properties in Wi-Fi fingerprinting based indoorlocaliza- tion,in:Proceedings of the IEEE International Conference onAcoustics , Speech and Signal Processing ( ICASSP ) , Brisbane ,April 2015.[5]M. Alfakih,M. Alberghe,H. Benoudnine,高斯混合建模,用于测量结果如图所示。 2(两行MSE,因为w2=1−w 1。4. 结论在本文中,已经引入了一种新的方法来考虑在WF- IPS中测量的Wi-Fi RSS数据中存在模拟数据的实验结果表明,我们提出的EM算法能够产生GMM的参数估计在删失和丢弃的数据存在比现有的方法更好。通过利用我们提出的EM算法,在训练中进行的估计参数的误差门定位WI-FI系统,在:3rd Int.Conf. 控制、工程和信息技术(CEIT),Tlemcen,阿尔及利亚,2015年。[6] A. Goswami,L.E.Ortiz,S.R.这是WiGEMA learning-based approachfor indoor localization,in:ACM CoNEXT,Tokyo,Japan,2011.[7] A.P. 新墨西哥州登普斯特Laird,D.B.Rubin,通过EM算法从不完全数据的最大似然,J.R. Stat. Soc. Ser. B Stat.美沙酮(1977)1-38。[8] G. 李角,澳-地Scott,截断和删失数据下多变量高斯混合模型的EM算法,Comput。国家主义者。数据分析 56(9)(2012)2816-2829。[9] J.R. 宾 夕 法 尼 亚 州 好 时 Olsen , Approximating the kullback leiblerdivergence between gaussian mixture models,in:Proceedings of theIEEE International Conference on Acoustics , Speech and SignalProcessing(ICASSP),Honolulu,April 2007.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM Java项目:StudentInfo 数据管理与可视化分析
- pyedgar:Python库简化EDGAR数据交互与文档下载
- Node.js环境下wfdb文件解码与实时数据处理
- phpcms v2.2企业级网站管理系统发布
- 美团饿了么优惠券推广工具-uniapp源码
- 基于红外传感器的会议室实时占用率测量系统
- DenseNet-201预训练模型:图像分类的深度学习工具箱
- Java实现和弦移调工具:Transposer-java
- phpMyFAQ 2.5.1 Beta多国语言版:技术项目源码共享平台
- Python自动化源码实现便捷自动下单功能
- Android天气预报应用:查看多城市详细天气信息
- PHPTML类:简化HTML页面创建的PHP开源工具
- Biovec在蛋白质分析中的应用:预测、结构和可视化
- EfficientNet-b0深度学习工具箱模型在MATLAB中的应用
- 2024年河北省技能大赛数字化设计开发样题解析
- 笔记本USB加湿器:便携式设计解决方案
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功