没有合适的资源?快使用搜索试试~ 我知道了~
埃及信息学杂志(2013年)14,135开罗大学埃及信息学杂志www.elsevier.com/locate/eijwww.sciencedirect.com原创文章基于混合方法的医疗RFID数据异常A. Anny Leemaa,*,M.Hemalathaba印度哥印拜陀卡尔帕加姆大学b部印度哥印拜陀Karpagam大学软件系统系接收日期:2012年11月2日;修订日期:2013年1月24日;接受日期:2013年2月17日2013年3月26日在线提供摘要RFID技术以其功能性强、成本低、可靠性高、使用方便等特点,已经渗透到医疗保健领域。它被部署用于各种应用程序,RFID读取器捕获的数据根据时间戳增加,导致大量的数据重复,误报和漏报。由RFID阅读器产生的脏数据流是限制RFID技术广泛采用的主要因素之一。为了给RFID应用提供可靠的数据,有必要对收集的数据进行清理,并且在入库之前应以有效的方式进行清理。现有的处理异常的方法有物理方法、中间件方法和延迟方法。分析了现有方法的不足,发现将中间件和延迟方法相结合可以构建健壮的RFID系统。我们提出的算法的基础上的混合方法进行了测试,在医疗环境中预测假阳性,假阴性,和冗余数据。在本文中,医疗环境模拟使用RFID和RFID阅读器观察到的数据包括异常假阳性,假阴性,和重复。实验评估表明,我们的清洗方法去除RFID数据中的错误更准确,更有效。因此,借助有计划的数据清理技术,我们可以降低医疗成本,优化业务流程,简化患者识别流程,并提高患者安全性。©2013制作和主办由Elsevier B.V.代表计算机与信息学院开罗大学。*通讯作者。联系电话:+91 9884208328。电子邮件地址:annyleema@gmail.com(A.A.Leema),hema.bioinf@gmail.com(M. Hemalatha)。开罗大学计算机和信息系负责同行审查。制作和主办:Elsevier1. 介绍RFID是一种使用标签和阅读器之间的无线电通信来自动识别物品位置的技术。在RFID阅读器的网络化环境中,大量的数据来自RFID阅读器的激增[1]。应用程序不能直接使用读取器生成的原始数据,因为它包含大量的数据重复、假阳性和假阴性。因此,RFID数据存储库必须应对1110-8665© 2013由Elsevier B. V.代表开罗大学计算机与信息学院制作和主办。http://dx.doi.org/10.1016/j.eij.2013.02.003关键词RFID数据问题; RFID在医疗保健中的应用;方法论;RFID检测模型;有效性136A.A. Leema,M. 赫马拉塔质量问题的数量。这些数据质量问题包括数据冗余、误报和漏报。糟糕的数据质量会在组织的操作、战术和战略层面上产生不利影响。在医疗保健领域尤其如此,成本压力和改善患者护理的愿望推动了整合和清理组织数据的努力。2. RFID数据RFID数据采集和传输不可靠。应用程序动态生成读数,这些读数随时间变化,并且本质上是临时的。产生了大量的原始RFID数据流,并且分析起来非常复杂[2,3]。根据系统的不同,这些信息可以在30英尺的距离内读取,有时也可以写入。在现实世界的RFID部署观察到的读取率通常在60-70%的重复或缺失的数据可能会导致错误甚至模糊的统计数据。这些应用的成功在很大程度上取决于RFID阅读器产生的数据流的质量[4,5]。阅读器应检测其附近存在的标签,而不能检测其范围外存在的标签和由于其范围而存在的标签。无法检测到其业务规则。在清理RFID数据的有效性仍然是一个问题,即使有一些文学作品。现有的清洁技术在广泛的条件下工作,但由于高成本和复杂性而被忽视。因此,有效的预测和清理算法对于正确解释和分析RFID数据至关重要。3. 目标阅读器是检测节点,部署在不同的位置。每个检测节点都由一个唯一的ID作为位置ID来识别。RFID标签位于不同的位置,可以被这些读取器检测到。考虑到RFID系统部署的复杂性和它所迎合的各种业务需求,数据不准确是不可避免的。原始数据不能被高端应用程序直接使用,除非它们被过滤和清理。目标如下:将中间件技术与延迟方法相结合,克服了现有延迟方法的不足.为了开发有效的数据清洗技术,采用混合方法来处理异常假阳性、假阴性和重复的高准确性和较低的复杂性。将无错误数据用于高端应用。模拟医疗保健环境并测试医疗保健数据集中的异常清除算法[6]。4. 问题定义在RFID数据中,错误和冗余的可能性很高,这导致RFID技术的有限部署[7]。RFID数据读取中有三种类型的错误。它们是意想不到的读数、误读和重复读数。RFID阅读器周期性地向其范围发送RF信号。当在阅读器范围内移动的RF标签接收到信号时,它将发送响应信号以及其唯一的标识符代码,时间戳和位置ID。阅读器接收响应信号并将数据流注册为一个条目。会有一些射频标签,不应该被读取器检测到,并且可能由于读取器发送的RF信号的空间发散而被读取。这些读数被称为假阳性读数[8,9]。在读取器的读取范围内的大量标签实际上,很少有标签可能在每个周期中不被读取,尽管存在于被称为假阴性或漏读的有效检测范围重复读数分为读数重复和数据重复。前者发生在标签位于多个同时向其发送信号的阅读器附近时。考虑阅读器R1、R2和R3冗余的情况,因为标签T1同时被所有三个阅读器读取,因此负责阅读器级冗余。后者发生在阅读器在一定时间间隔内读取大量非差异信息时。 例如,在医院管理系统中,被标记的实体(比如医生)可以移动到他的诊室并且坐一整天,并且通过放置在他附近的读取器不断地将数据发送到RFID管理系统。但是,从人的角度来看,事件检测最有用的信息是标记实体(比如医生)何时进入和离开他的诊室。因此,有必要在处理之前减少RFID数据冗余。5. 现有方法我们工作的第一步是分析三种现有的物理、中间件和延迟的方法。在现有的物理方法中,成本增加,周期增加,发生标签冲突并且出现重复,而中间件方法处理低复杂度异常并且在噪声环境中不是非常有效。在延迟方法中,在将数据存储到数据库中之后,清理是有限的,并且异常不会被正确地清理。在这三种方法中,异常在一定程度上被清除,但会导致其他一些异常。 图 1描述了三种不同的现有数据清理方法及其局限性。6. 该方法图2所示的所提出的方法是中间件和基于延迟的蜂窝模型的混合方法,其可以用于检测范围读数之外。RFID阅读器具有全向天线,因此,相邻区域有可能相互重叠。中间件部署在读取器和应用程序之间,以纠正捕获的读数和正确的数据解释[10]。●●●●●●●基于混合方法的医疗RFID数据异常预测算法137图1现有方法及其局限性。图2所提出方法的架构图。在这种方法中,并不总是能够消除所有类型的异常和冗余[11]。原始数据在进入数据库的主表之前进行了一定程度的处理[12]。在不同层面验证数据以确保数据一致性,监控传入数据流,提供与现有医院管理系统的实时集成,将数据映射到相关数据库表,以及重新定义和执行业务规则集是这里完成的各种主要功能业务上下文是动态的,在数据加载期间甚至没有被框定。已知的异常复制在RFID中间件中处理,但其他异常的处理被推迟到查询时间。每个应用程序通过定义清理规则来指定自己的异常。这些规则不会直接更改数据库内容,而是仅在应用程序问题查询●●●●●138A.A. Leema,M. 赫马拉塔●●6.1. 拟议系统所提出的系统的主要属性如下:最高的预期成本降低。用最少的资源清理大量的标签读数。● 有效和准确的数据清理技术。● 易于维护和更新数据。● 更少的时间和工作人员。7. RFID在医院管理中的RFID可以应用于所有的应用领域,但RFID在医疗保健领域的作用更为重要。这是一个地方,一个小小的错误就可能要了一个人的命然而,人类更容易犯错误。有必要尽量减少人为干预,从而将出错的可能性降到最低.射频识别(RFID)的技术发展刚刚开始进入医疗保健领域。RFID(射频识别设备)是通过减少用药错误和改善患者护理为医疗保健行业提供更好解决方案的最佳技术。射频识别在医疗保健领域的技术应用似乎增长迅速。现代化的RFID也开始提供比传统条形码更广泛的患者身份识别,并跟踪和定位医院内的资本设备。在未来的几年里,RFID技术可以用于各种应用,包括跟踪和匹配输血的血液,跟踪药品,以及打击假冒伪劣产品。图3医疗行业图4拟议方法的概念图。基于混合方法的医疗RFID数据异常预测算法139医疗产品。RFID系统功能强大,捕获数据准确。这些设备可以轻松集成到医院的无线基础设施中在医疗保健行业使用RFID技术的潜在好处是提高病人只有将RFID技术与现有的医院信息系统相结合,才能发挥其真正的价值。它可以通过现有的医学知识提供有价值的过程集成决策支持。此外,它还可以全面使用患者数据进行研究和医疗报告。在医疗保健中使用RFID的好处见图。3.第三章。7.1. RFID在医疗行业的优势与其他识别技术相比,RFID系统具有许多优势:在医疗领域部署RFID,打造优雅的医院环境。通过防止错误来提高患者的安全性。简化患者识别流程降低医疗成本增强了安全性提高运营效率。建议的工作预测和清理异常的有效方式。● 避免设备盗窃和婴儿盗窃。● 促进有效的工作流程管理。7.2. 方法本文采用的方法是自上而下的方法,也称为逐步设计,基本上是分解系统以深入了解其组成子系统,如图4所示。在自上而下的方法中,系统的概述是制定的,指定但不详细说明任何一级子系统。然后,每个子系统被更详细地细化,有时在许多额外的子系统级别,直到整个规范被简化为基本元素。8. RFID检测模型读取器检测模型基于图5中描绘的RFID标签-读取器检测区域,并且无源RFID读取器标签系统的三个不同的操作区域如下:● 强场● 弱场● 外地地区。8.1. 强内场区标签响应几乎所有来自读取器的尝试。因此,强内场区的应答率非常高。8.2. 弱场区标签对来自读取器的大多数尝试做出响应,并且标签性能随后随着该领域中距离的增加而逐渐降低。8.3. 外场区标签几乎不响应来自读取器的任何尝试。答复率往往变得微不足道。RFID部署环境中的检测范围在读取器位置复杂且重叠的情况下起着重要作用。9. 我们的前提所提出的数据清洗算法可以应用于任何类型的应用。RFID在医疗保健中的作用更加重要,因为微小的错误会导致严重的财务和个人损失。读取器是部署在图6中描绘的医院中的不同病房中的检测节点。每个检测节点都由一个唯一的ID标识,该ID用作位置ID。阅读器将监控其频率范围内的标签[13]。部署RFID的原因是图5读卡器检测模型。●●●●●●●表2分析RFID标签读数。个案研究1正常2交叉并联345正常法向相邻纬线67正常相邻平行891011正常正常交叉邻渡线12相邻交叉数据分析P10004的读数是在分配的时间和分配的日期从分配的位置读取的107不是相邻单元,但P10004在同一时间和日期P10004的读数是在分配的时间和日期从分配的位置读取的P10004的读数是在分配的时间和日期109是相邻单元,P10004在同一时间和日期P10004的读数是在分配的时间和日期105是相邻单元,P10004在同一时间和日期P10004的读数是在分配的时间和日期从分配的位置读取P10004的读数是在分配的时间和日期从分配的位置读取110不是相邻单元,P10004由110读取,而不是由分配的位置(102)读取105是相邻单元,P10004由105读取,而不是由分配的位置(102)在同一时间和日期读取109是相邻单元,P10004由105读取,而不是在同一时间和日期由分配的位置(102)读取140A.A. Leema,M. 赫马拉塔图6 RFID系统设计。识别、认证、定位或自动数据采集(ADA)[14]。读/写范围是读取器和标签之间的通信距离读取范围是从标签读出数据的最大距离,而写入范围是从读取器[15]第15话不同位置的RFID标签由这些读取器检测。RFID数据的最大挑战之一是数据量。将TB级数据发送到集中式系统进行数据清理需要高性能服务器以及高速网络,这将不可避免地增加总硬件成本。一些数据清理方法适用于读取器获取的数据,一些需要RFID中间件,另一些需要集中式数据处理服务器来处理原始数据。服务器级数据观察包括数据验证、数据不一致性和进入企业应用程序数据库之前的异常识别。业务上下文是动态的,在数据加载期间甚至没有被框化。已知的异常复制在RFID中间件中处理,但其他异常的处理被推迟到查询时间。每个应用程序通过定义清理规则来指定自己的异常。10. 用于重复检测和消除的CBADECBADE算法检查标记对象是否在同一时间戳被多个读取器读取,然后发生重复,并将其称为相邻表1 读者观察到的样本读数为例标签Id位置位置ID日期时间1P10004普通病房10210/4/2012五点整2P10004访客区10710/4/2012五点十分3P10004普通病房10210/4/2012五点十分4P10004普通病房10210/4/2012五点十五分5P10004咨询区10910/4/2012五点二十分6P10004普通病房10210/4/2012五点二十分7P10004婴儿病房10510/4/2012五点二十分8P10004普通病房10210/4/2012五点二十五分9P10004普通病房10210/4/2012五点半10P10004药房11010/4/2012五点四十分11P10004婴儿病房10510/4/2012六点整12P10004咨询区10910/4/2012六点半基于混合方法的医疗RFID数据异常预测算法141并联这是因为在多个读者的阅读附近的重叠,它被称为读者级重复。当RFID读取器重复读取同一对象时,数据级别的重复读取就会发生。提出的CBADE预测和清除中间件方法中的重复。中间件清理后的数据存储到数据库中指定RFID标签及其移动性的规则。 它定义所有允许的标记位置组合的列表。时间戳在这里定义了一种假设或设定规则,该规则指定RFID标签及其在具有时间限制的前提条件中提到的特定区域中的有效性。它定义了特定标记-位置组合的所有允许时间窗口12.一种用于假阴性检测和消除的R-PFN算法11. 一种用于误报检测和消除的R-PFP算法中间件清理后的数据存储到数据库中。在这里,基于先决条件的算法R-PFP检查标签是否在指定时间处于分配的位置。如果这是完全正确的,那么就没有异常。在该算法的帮助下,在延迟方法中检测并清除假阳性的存在。前提是假设或集合在所提出的R-PFN算法中,获得了参数的初始估计集。给定这些估计值和作为输入的训练数据,该算法然后找到缺失的数据。为了消除误报和漏报,业务层检查标签的状态列。如果前一个值为0,当前值为1,下一个值为0,则此数据为假阳性,应予以消除。 此外,如果前一个值为1,当前值为0,下一个值为1,则该数据为假阴性,应被消除。图7医疗保健模拟器。算法误报(Reader[ ],Tag [ ])Set=所有Tag_Id的初始位置NewSet= 0;While not(Ta_detection)do beginM= Choose(M);//查找相关Loc_Id的相邻集合M =Crossover(M);//检查Tag_Id是否在相邻集合M = Alteration(Loc_Id,M,Tag_Id);突变集合(原始)和相邻集合用最多-ve Coe更新NewSet;结束;S1= NewSet覆盖的数据集,返回(Newset/S1);结束算法CBADE(Reader[ ],Tag [])//输入:读卡器R1,读卡器R2//输入:Tag 1,Tag 2,Tag 3. . 标签n开始对于(读取器X(X= A,B)中的每个标签),如果所有Tag_id中的计数(选定Tag_Id)>1,则Sub(Each Similar Tag_Id timestamp-SelectTagId Timestamp)=0;return检测到重复并清除异常;选择Max(Tag IdTimestamp)删除其他Tag_Ids; //保留当前值并删除其他重复元组其他return无重复; endfor142前提条件=0f违反标记-位置组合的集合规则前提条件=1fit不违反标记位置组合的集合规则A.A. Leema,M. 赫马拉塔时间戳=05违反时限设定规则时间戳=15未违反时限设定规则图8所提出的算法的样本输出●●●●基于混合方法的医疗RFID数据异常预测算法143用C#设计的模拟器,SQL Server 2008作为后端,以评估所提出的算法的性能,如图7所示。所提出的算法的结果在图8中给出。我们的RFID数据中出现异常的情况如图9所示。所提出的方法已被评估使用四个指标精度,召回率,E-措施,和准确性。精度是读取器观察到的相关标签读数的数量与检索到的不相关和相关记录的总数的比率。从数学上讲,精密度:真阳性=真阳性=假阳性13. 模拟长期以来,仿真一直被用作各个部门的决策支持工具。它特别适合于医疗保健组织的分析,因为它能够处理这个部门通常固有的高度复杂性和可变性。它还通过与通过数据库结构开发的软件代理集成,作为持续质量改进框架。不同工作流程的实验,人员决策和假设分析都是模拟在医疗保健中有前途的应用,但在医疗保健环境中实际上是不可行的。模拟研究需要在相当长的一段时间内精心收集14. 实验结果与评价案例研究:例如,假设患者Hari从下午5:00起在普通病房(102)。到5.30由患者Hari的读取器观察到的样本读数在表1中给出。用我们提出的算法测试观察到的读数,并分析标签读数的状态,如表2所示。14.1. 示例输出本文使用的RFID数据集80%作为训练数据,20%作为测试数据。ð1Þ召回率是读取器读取的相关标签读数的数量与数据库中相关记录总数的比率。调用¼True 正态分布正态分布=真态分布 阳性正常假阴性漏读误差度量是E-度量,使用以下公式计算,Ep;r1-2=1=p] 1=r]3实验的准确性是衡量实验结果与真实或可接受值的接近程度。它被计算为准确度¼真阳性率真阴性=真阳性率<$真阴性<$假阳性<$假阴性:ð4Þ14.2. 结果分析我们已经分析了我们提出的算法与现有的算法在精度和召回方面的性能。我们用2000个错误数据模拟了10,000个样本,并看到了清洗算法的结果。CBADE 算 法 的 数 据 清 理 率 达 到 97% , 结 果 表 明 ,CBADE算法比SMURF,Bspace,WSTD和BBS具有更好的执行时间和更好的数据清理率。 10实验结果表明,该算法具有71%的准确率和95%的召回率。实验结果表明,R-PFP算法在平均查准率、查全率、E图9异常假阳性、假阴性和重复的发生率假阴性消除状态标志0 -不可用状态标志1-可用输入:读卡器R1、读卡器R2输入:标签1、标签2、标签3.. . 标签n开始对于(在时间t读取器X(X= A,B)中的每个时间戳=0)返回如果(t- 1= 0; t+ 1= 0; t= 1前提条件=0或时间戳=1)返回“”假阴性-待排除“”;结束Endfor结束否则,如果(t- 1= 1; t+ 1= 1; t= 0前提条件=1或144 A.A. Leema,M. 赫马拉塔百分之一百二十百分百百分之八十百分之六十百分之四十百分之二十0%的百分比纠正重复异常已清理数据的百分比因此,所获得的结果表明,所提出的R-PFP算法在平均精确度、召回率、E15. 结论RFID在医疗保健应用的所有子领域都发挥着重要作用。尽管有许多文学作品可供使用,但在医疗保健部门清洁RFID数据的有效性仍然是一个问题。在最大程度上,读取的脏数据甚至可能导致患者这些错误需要在一个有效的清洗图10 CBADE与现有算法的比较研究。图11R-PFP与现有算法的比较研究。图12 R-PFN与现有算法的比较研究。明显优于图1所示的所有其他清洁算法。 11实验结果表明,该算法具有81%的准确率、91%的 召回率和76%的 准确率。 12个。在进入仓库之前,必须采取有效的措施。目前纠正漏读的解决方案通常使用时间窗滤波。一个严重的问题是,一个单一的静态窗口大小不能补偿错过的读数,同时捕捉动态的标签运动。自适应时间窗滤波不能处理标签总是移动的情况。在本文中,我们提出了算法来清除异常的假阳性,漏读,和重复。决定记录与每个标记事件相关联的所有值以供将来参考,否则将丢失太多有效数据。最后,管理层可以分析数据,并根据需求应用业务规则进行过滤。提出的算法基于中间件和延迟的集成来预测和清除异常.我们的实验结果证明,我们的算法预测和消除异常的有效方式相比,现有的作品。因此,它将铺平道路的数据仓库系统的有效手段,将保持RFID数据的安全,为未来的挖掘。引用[1] 舒武奥、巴德霍奥射频识别技术:发展、应用和安全问题。Pac J Sci Technol 2006;7(2).[2] 科查尔·巴杰什奇拉·拉金德一个有效的RFID数据仓库系统,使用新的数据清洗,数据转换和加载技术。Int Arab JInf Technol 2012;9(3):208-16.[3] Massawe Libe Valentine,Kinyua Johnson DM,Vermaak Her-man。使用自适应滑动窗口方法减少RFID数据流中的假阴性读取。开放获取国际科学杂志2012:4187-212.[4] 孟令勇,于凤岐。基于自适应窗口的RFID数据清洗。IEEE2010第二届国际会议; 2010年。p. 746-9[5] 使用RFID Anywhere EdgeProcessing成功管理数据。。[6] Leema Anny,Hemalatha M.一种有效的自适应数据清洗技术,用于医疗保健中的大量RFID数据集。WSEAS Trans InfSci Appl,ACM Digital,Library 2011;8(6):243-52。[7] Jeffrey Shawn R , Garofalakis Minos , Franklin Michael J.RFID数据流的自适应清洗。ACM第32届超大型数据库国际会 议 ( ACM 32nd International Conference on Very LargeData Bases,2006)第163- 174页。[8] 达西·彼得,普平维瓦·普拉帕萨拉,斯坦蒂克·贝拉。 RFID技术部署面临的挑战和问题。澳大利亚:格里菲斯大学集成与智能系统研究所; 2011年,p. 1比26基于混合方法的医疗RFID数据异常预测算法145[9] 范华,吴泉源,林义松。基于行为的清理不可靠的RFID数据集。Sens J 2012;12(8):10197[10] 李贝·瓦伦丁·马索,约翰逊·金尤亚DM,赫尔曼·维尔马克.使用自适应滑动窗口方法减少RFID数据流中的假阴性读取。开放获取国际科学杂志2012:4187-212.[11] 奇拉·拉金德·辛格,科查尔·巴杰什。一种新的有效的RFID数据仓储方法:阅读器加载感知方案。美国科学研究杂志2009;4:85[12] 放 大 图 片 作 者 : Rao Jun , Duraisamy Sangeetha , ThakkarHetal,Colby Latha S. 一种用于RFID数据分析的延迟清洗方法。ACM Very Large Data Base Endowment; 2006.p. 175比86[13] 奇拉·拉金德,科查尔·巴杰什。一种有效存储RFID数据的新方法。读取器加载感知方案。美国科学研究杂志2009;4:85-95。[14] 萨巴吉·阿斯加尔,瓦迪亚纳坦·甘内什。RFID技术在供应链管理中的有效性和效率:战略价值和挑战。J Theor Appl,Electronic Comm Res 2008; 3(2):71-81.[15] Srinivasa Rao S,Rajan EG,Lalkishore K.使用RFID标签进行 人 类 活 动 跟 踪 IJCSNS Int J Comput Sci , Netw Secur2009;9(1):387
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功