收稿日期:20180720;修回日期:20180910 基金项目:国家自然科学基金青年基金资助项目(61701122);广东省产学研重大专项资
助项目(2016B010108004);广州市重点科技项目(201604020016);广东省产学研专项资助项目(2014B090904080)
作者简介:梁天恺(1993),男,广东肇庆人,硕士,主要研究方向为数据挖掘(tiankai.liang.gdut@outlook.com);曾碧(1963),女,广东广州人,
教授,博士,主要研究方向为智能信息处理、智能机器人;刘建圻(1982),男,江西赣州人,副教授,博士,主要研究方向为物联网与大数据技术.
基于 FPGrowth的智能家居用户时序
关联操控习惯挖掘方法
梁天恺
a
,曾 碧
a
,刘建圻
b
(广东工业大学 a.计算机学院;b.自动化学院,广州 510006)
摘 要:针对传统关联规则挖掘算法无法高效且准确地挖掘出隐含于用户操作记录中的时序关联操控习惯,提
出一种基于 FPGrowth的智能家居用户时序关联操控习惯挖掘算法。该算法分为三个阶段,分别为基于用户操
控动作森林、改进的 FPGrowth算法和一种时间约束规则进行事务集的生成、时序频繁项集的生成以及最终时序
关联操控习惯的生成。最后,使用真实用户操控记录进行对比实验,结果表明该算法能提高生成事务集的效率,
并能更准确地发现用户操控家居设备的时序关联习惯。
关键词:智能家居;行为预测;数据挖掘;关联分析;个性化推荐
中图分类号:TP301.6 文献标志码:A 文章编号:10013695(2020)02014038505
doi:10.19734/j.issn.10013695.2018.07.0527
FPGrowthbasedusertemporalassociationcontrolhabitsmining
methodforsmarthome
LiangTiankai
a
,ZengBi
a
,LiuJianqi
b
(a.SchoolofComputer,b.SchoolofAutomation,GuangdongUniversityofTechnology,Guangzhou510006,China)
Abstract:Concerntheproblemthatthetraditionalassociationanalysisalgorithmscannotefficientlyandaccuratelyminethe
user
’spotentialtemporalassociationcontrolhabitswhichareimpliedintheuser’soperationrecords,thispaperproposedano
velusertemporalassociationcontrolhabitsminingmethodbasedonFPGrowth.Thismethodincludedthreestages:togenerate
thetransactionset,thetemporalfrequentitemset,andthefinaltemporalassociationcontrolhabitsviatheuseroperationaction
forest,theimprovedFPGrowthalgorithmandatimeconstraintrule.Finally,thecomparativeexperimentsbyusingtherealuser
controlrecordsshowthatthismethodcanimprovetheefficiencyoftransactionsetgenerationandcanmoreaccuratelydiscover
theuser’stemporalassociationhabitsofsmarthomedevices.
Keywords:smarthome;behaviorprediction;datamining;associationanalysis;personalizedrecommendation
0 引言
随着物联网技术、计算机网络技术以及数据挖掘技术的跨
越式发展,智能化成为新世纪发展趋势的新代名词。在此大背
景下,智能家居的发展也呈现出突飞猛进的态势
[1]
。智能家
居系统是以个人家居空间为主要平台,通过物联网技术将家居
设备连接到网络中,实现家居设备的远程操控,构建高效的住
宅设施与家庭日程事务的管理系统
[2]
。智能家居系统的智能
化水平分为三层
[3]
。低级智能化水平只实现智能家居设备的
简单远程操作,即用户可以通过移动终端将控制指令通过无
线 /有线网络发送到智能家居系统的控制中心,然后控制中心
通过家居网络将指令下发给相应的家居设备,最终实现智能家
居设备的远程操作
[4]
。中级智能化水平则实现了基于环境感
知的家居设备触发式自动化控制
[5]
。例如,用户自定义规则
“当室内温度高于
30℃时,帮我打开空调”。此后,智能家居
系统将通过连入到家居网络的温度传感器来感知室内环境,当
室内环境的变化达到触发预定规则的阈值时,即室内温度高于
30℃时,系统将自动进行相应的操控,即打开空调。最高级别
的智能化水平则要求智能家居系统具备学习能力,能从大量用
户操控记录中学习到用户对家居设备的操控习惯,并代替用户
在适当条件下自主地操控家居设备,实现家居设备真正意义的
智能操作
[6]
。用户对智能家居设备的各种操控行为之间存在
一定的联系和规律,若能将这种潜在的关联性操控习惯从用户
历史操控记录中识别出来,并利用其进一步开发出更了解用户
的智能家居系统,有利于智能家居行业的发展更趋向于智能家
居系统的最高层次智能化水平
[7,8]
。
目前,国内外研究人员对用户的关联性操控习惯挖掘的研
究已有一定的成果。例如,文献[
9]提出使用 Apriori关联分析
算法来挖掘隐含在用户历史交互记录中的关联操控习惯。但
该方法所得到的关联性操控习惯规则,只是简单表达出用户各
操控动作之间的关系,并未能完整表达出用户操控动作之间的
时间特性,因此该算法的学习能力比较低下。相似的还有文献
[
10]提出的一种基于假设检验的关联分析算法,该算法进一
步证明家居设备间的确存在较强依赖关系且能被有效挖掘。
其次,为了提高关联分析算法对混杂数据以及缺失数据的抗噪
能力,Heierman等人
[11]
利用情节发现(episodediscovery,ED)
算法来识别用户的操控行为中隐含的关联关系,一定程度上提
高了算法处理大规模混杂数据的能力。为了进一步提高算法
对大规模数据的处理能力,文献[12]基于 ART(adaptivereso
nancetheory)网络提出一种双层 ART1模式分类方法,对用户
第 37卷第 2期
2020年 2月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol37No2
Feb.2020