没有合适的资源?快使用搜索试试~ 我知道了~
⃝可在www.sciencedirect.com上在线获取ScienceDirectICTExpress 6(2020)204www.elsevier.com/locate/icte基于群体偏好的隐私保护兴趣点推荐系统Xiwei Wanga,Jiang,Minh Nguyena,Jonathan Carra,Longyin Cuib,Kiho Limca美国伊利诺斯州芝加哥市伊利诺斯州东北大学计算机科学系b美国肯塔基州列克星敦市肯塔基大学计算机科学系c美国新泽西州韦恩市威廉帕特森大学计算机科学系接收日期:2020年2月29日;接收日期:2020年4月27日;接受日期:2020年5月15日2020年5月21日网上发售摘要具有其内置位置服务的无处不在的智能电话使得人们能够通过基于位置的应用探索各种兴趣点(POI),例如,Yelp和FoursquareCity Guide。通过这些应用程序,用户可以收到附近地点的个性化推荐,例如,这不仅节省了他们的搜索时间,而且还有助于找到他们感兴趣的POI。这些应用程序和几乎所有现有的推荐系统的一个问题是,它们要求用户与服务提供商共享他们的偏好数据。这些信息如果使用不当,可能会泄露用户的隐私。在本文中,我们提出了一个基于群体偏好的POI推荐方案,融合了矩阵分解和聚类技术,以提供高质量的建议,而不牺牲用户c2020年韩国通信与信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:兴趣点;隐私;推荐系统;矩阵分解;群体偏好1. 介绍在高速互联网和智能手机无处不在的时代,每秒都在产生各种类型的数据。当人们在信息海洋中航行时,这很容易让他们不知所措。为了引导他们在这段旅程中,推荐系统[1]被提出并在许多涉及大量数据的应用程序中实现。当基于位置的社交网络(LBSNs)变得流行时,对他们的推荐的需求也出现了高需求导致了旨在向用户呈现附近地点的移动应用程序Foursquare城市指南,Yelp!,和谷歌地图据我们所知,所有这些应用程序都要求用户与服务提供商分享他们的访问/签到历史记录和/或个人偏好。通过这样做,服务器可以创建每个用户的简档,并且基于这些简档做出推荐。在此过程中,由于从用户收集的信息反映了他们的个人品味和行为,∗ 通讯作者。电子邮件地址: xwang9@neiu.edu(X. Wang),m-nguyen21@neiu.edu(M.Nguyen),j-carr3@neiu.edu(J. Carr),cu225@uky.edu(L.Cui),limk2@wpunj.edu(K.Lim)。同行评审由韩国通信和信息科学研究所(KICS)负责https://doi.org/10.1016/j.icte.2020.05.005很敏感为加强对网上隐私的保护,2018年5月,欧盟颁布了《通用数据保护条例》(GDPR),赋予网络公民对自己数据的控制权,允许他们选择存储哪些类型的信息以及服务提供商如何使用这些信息。该法规旨在限制对用户个人数据的访问,但它不是技术解决方案的简单替代。在一些情况下,对于在线推荐系统,如果用户选择不共享他/她的任何偏好数据,包括访问/登记历史、在线浏览/点击记录、产品评论/评级等,则不可能进行个性化推荐,因此用户会迷失在成千上万的产品、电影或本地兴趣点中。隐私保护的兴趣点推荐系统[3-位置和偏好。然而,它们要么需要额外的知识,例如嵌入在社交网络中的友谊或可信信息,要么需要存储和维护拓扑图用户的地理坐标。前者的信息并不总是可用的,后者泄露了用户在本文中,我们提出了一个基于群体偏好的推荐系统,利用矩阵分解,聚类,2405-9595/2020韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。X. Wang,M.Nguyen,J.Carr等人/ICT Express 6(2020)204205∈⃗ ∈=1个=以及匿名自组织无线对等(P2P)通信,以在不损害用户系统假设中央服务器和其他用户都是不可信任的。用户总是在自己的移动设备上保留个人偏好和访问历史记录。他们偶尔会通过Wi-Fi Direct在点对点网络上与附近的用户匿名分享他们的评级,以便建立本地群组及其相关偏好。然后,这些首选项也以匿名方式上传到服务器。通过用户共享的本地组偏好,服务器执行矩阵分解以学习组和位置的潜在因素。当在用户设备上预期推荐时,它从服务器检索潜在因素并重建全局组偏好。因此,它可以识别用户属于哪些组,并可以相应地进行个性化推荐。在整个过程中,不会与服务器共享任何个人偏好。同时,只有一个附近的用户可以从发送者接收匿名评级,并且在此一次性通信之后,ad hoc P2P连接被取消,这使得无法猜测发送者的身份本文的其余部分组织如下。次第二部分是相关工作。第3节描述了所提出的方法的主要第4节介绍了实验并讨论了结果。结论性意见见第5段。2. 相关工作在[4]中,Chen等人提出了一种分散的训练技术,该技术在每个用户端学习矩阵分解模型[6,7]在他们的方案中,个人用户评级始终保存在他/她自己的设备上。通过交换附近用户之间的损失函数的梯度来学习局部和全局潜在因子[8]。通过融合局部用户潜在因素、局部项目潜在因素和全局项目潜在因素来为特定用户做出推荐。虽然不需要集中计算,但它们的用户-用户通信基于随机游走技术,该技术需要存储和维护用户相邻图。这个图不仅需要不断更新,而且还会将用户此外,在他们的论文中还不清楚该图存储在何处以及如何存储。然而,在我们提出的模型中,用户只需将组偏好上传到服务器,这些偏好完全在他们自己的设备上生成和学习。为了确保没有恶意用户的身份攻击可以成功在这个过程中,我们只执行附近的用户通信的评级交换匿名的ad hoc网络。它不需要任何相邻的用户图,因此不会暴露任何已识别的位置信息。Wang等人[9]提出了一种基于邻近度的社交网络P2P通信方案利用Wi-Fi Direct与附近的用户通信。他们的模型的优点是可以在不使用基础设施网络的情况下交换数据。用户只需要在他们的设备可以连接。由于涉及的实体较少,用户的隐私不太可能被侵犯。王等人的补充。Aneja和Gambhir [10]提出了一种使用Wi-Fi Direct的基于配置文件的自组织社交网络。他们的方法使用类似“用户名#用户兴趣“的字符串附近的用户。具有相同兴趣的人可以连接到这个网络并进行P2P通信。在我们的工作中,我们建议利用Wi-Fi Di-rect技术,以促进附近的用户通信。为了匿名化数据交换,每个设备一旦附近用户的设备看到此SSID,它将提示用户,以便他/她可以决定是否分享他/她的评级。虽然通信是安全和匿名的,但用户仍然可以控制它。3. 方法如图1所示,本文提出的模型涉及三种类型的实体,即,中央服务器、用户及其附近的用户。中央服务器保存一个效用矩阵RRm×n,代表群体的区位偏好(in关于位置的评级或签到记录的术语),其中存在m个用户组和n个位置(POI)。 R中的条目rij反映了组i对特定位置j的偏好。 rij1表示完全失望,而rij5表现出强烈的好感。对于每个用户u i,偏好向量u iR×n 在这个用户已经访问过的信息被存储在他/她的移动终端上,并且在访问新的地点时被更新。当该用户的设备通过搜索具有预定义SSID(例如,以“RecSysDataExchange#“开头的字符串如果只有几个附近的用户,发送者的身份有更高的机会被物理暴露,所以他/她不应该发起此通信。只有当超过一定数量时,才可以安全地进行交换的(例如,10)与发送者关系密切的人注意,除了偏好之外,没有其他信息,包括但不限于用户身份、媒体访问控制(MAC)地址等,是共享的。一旦数据传输完毕,连接将立即终止。在我们的方案中,我们假设,一旦一个用户发送他/她的偏好给另一个用户,这些信息将不会与其他任何人共享,以减少服务器端的数据冗余。在用户已经从其他人接收到一定量的数据之后,他/她的设备使用k均值算法来根据匿名个体的偏好将其聚类为k1个组,并且匿名地发送组偏好,即,集群质心发送到服务器这些局部组偏好作为一系列行附加到效用矩阵R的末尾。随着数据的积累,服务器执行非负矩阵分解(NMF)[11]206X. Wang,M.Nguyen,J.Carr等人/ICT Express 6(2020)204∈构造一个子矩阵L∈R,其中p是数u∈+的参数化·F。我们使用梯度下降技术[8]最高余弦u,用GRk2×q表示,Fig. 1. 提出的模型。对多个用户收集的局部群体偏好进行分析,从而获得全局群体偏好的潜在因素。我们使用以下目标函数进行矩阵分解:minG≥0,L≥0f(R, G, L)=<$R−GLT<$2+α(<$G<$2+<$L<$2),(一)F F F图二、数 据 集 的评级分布。其中G∈Rm×q,L∈Rn×q是两个正交矩阵,q是秩,α+是Fr+obenius范数,α是正则r-找到这个目标函数的更新公式数据集包括11,917名用户,1,579家企业和33,770个评级(从1星到5星不等),从1月GijL←Gij←L{RL}ij{GLTL+αG}ij·{RT G}ij(二)(三)2007年至2017年12月。图2显示了企业的平均评分分布。我们通过按时间顺序对所有评级进行排序来预处理数据集,从从最早到最晚,分成34批,i jij{LGTG+αL}ij每个等级(最后一批有770个等级)。实验为了对用户ui进行推荐,他/她的移动设备首先从服务器检索潜在因子矩阵G和L,并重构效用矩阵R。由于维数较低,传递因子矩阵所需的通信资源明显少于传递因子矩阵所需的通信资源。R.对于u i访问过的地方l j(j [1.. n] u ij0),潜在因子向量,即,检索表示L中的ljp×q在五个地方。为了识别用户属于哪个组,每个组对访问位置的评级由GLT近似。只有具有相似性的前k2组i u专业技术使得.当用户靠近特定位置lt(其中向量lt是L中的行)时,通过取向量GultT中的元素的加权平均来预测偏好水平,其中相似性是权重。兴趣点是然后基于预测的喜爱级别来推荐值得注意的是,用户经常与中央服务器共享数据,因此需要定期在更新的组位置矩阵上重做NMF。当这些行变得过时时,服务器也应该将其删除4. 实验研究在Urbana-Champaign地区的Yelp商业评论数据集1的一个子集上对所提出的模型进行了检查。的1https://www. 是的。com/dataset.是以模拟现实世界场景的方式进行的,即,评级不是同时被接收,而是在不同的时间变得可用。我们假设在向服务器发送群组偏好之前,每个用户应该已经在不同的时间和地点从附近的匿名用户那里收到了大约1,000个评级。这些评级可以由用户位置矩阵表示。由于人们留下反馈的方式的性质,通常有大量的缺失值,使得矩阵非常稀疏。因此,每次构建矩阵时,这些组可以通过k均值算法来生成。组偏好被表示为几行评级,即,集群中心。它们作为一系列行附在小组地点评级矩阵的末尾。每次当组位置矩阵附加新行时,我们重新运行NMF,产生更新的潜在因子矩阵G和L。为了评估预测的准确性,在处理了每一批有了G和L,我们就可以使用上一节描述的方法来估计所选测试用户的评分。为了研究这种隐私保护模型如何影响预测准确性,我们实现了一个简单的NMF模型(称为“MFRS”),每个模型需要1,000个·X. Wang,M.Nguyen,J.Carr等人/ICT Express 6(2020)204207=-=-ˆ图3.第三章。N M F 中 等 级 的影响。批处理,估算原始评级并将其添加到现有用户位置矩阵(而不是组位置矩阵)的末尾,对其执行NMF,并对我们提出的模型中使用的相同测试评级进行估计。我们使用平均绝对误差(MAE)计算和测量预测精度。为了评估我们的模型对最近研究的性能,我们将其与Chen提出的分散 矩 阵 分 解 模 型 进 行 了 比 较等 在 [4] 中 ( 称 为“DMFRS”)。我们使用基于群组的推荐系统在所提出的模型中有几个参数需要确定,包括方程中的超参数α和q。(1)、在每个批次中创建并发送到服务器的组的数量(k1),以及在进行预测时为用户识别的组的数量(k2),如定义的在第3节。我们将α设置为0.3,因为我们的结果表明,该参数对性能的影响不大,0.3预测误差最小。关于NMF中的潜在因子,因为它们捕获了行和列对象的特征,所以应该仔细确定矩阵的秩。我们保留了k13和K210当我们研究秩q的影响时。计算每个批次的MAE,并使用平均误差进行比较。图3显示了具有不同等级的三个模型的性能。很明显,潜在因素的数量对所有三个模型的影响都很小。在下面的测试中,我们将MFRS和GBRS的等级设置为1,将DMFRS的等级设置为9,以获得最佳性能。当期望POI推荐时,用户侧程序需要识别他/她的组。为此,计算用户偏好向量和组偏好向量之间的余弦相似度。该程序只使用前k2组进行预测。对于每个位置,将其上的组偏好的加权平均值视为该用户的估计偏好与此同时,我们想探讨在以下情况下应该产生多少组:一批评级变得可用。我们的结果显示 当k1时,产生的MAE最好3和K210个。虽然这两个参数对图四、错 误 随时间的变化趋势。精确度很低,太多的组会减慢计算过程。由于人类的本性,我们的偏好会随着时间的推移而改变。在我们的实验中,我们研究了当更多组被添加到组位置矩阵时预测精度的变化。作为参考,我们使用等式(1)中所示的基线模型(四)、rui=µ+bi+bj(4)其中,rui是用户i在位置j上的预测评级,µ是训练评级的平均值,bi是用户i的偏差。 i图四是体现了这样的趋势。虽然DMFRS的总体误差随着时间的推移而降低,但平均值明显高于其他方法。将GBRS与两个非隐私模型进行比较,即,基线和MFRS,误差的增加部分可以忽略不计。 受此图的启发,我们研究了旧组偏好对预测准确性的影响,以帮助系统确定何时删除过时的数据并保持服务器上的知识最新。为此,我们删除矩阵R中的行,当它们达到一定的年龄时,并检查模型的性能。图5中绘制的MAE表明,通过删除两年的数据,平均预测准确度比非时间敏感版本提高了约1.69%。总括而言,拟议的绿化带重建计划性能优于分布式非负矩阵分解模型。根据与基线和简单NMF模型的比较,这是一个技术上合理的框架,不会以隐私换取预测准确性5. 结论在本文中,我们提出了一个基于群体偏好的隐私保护的兴趣点推荐系统。它利用矩阵分解,聚类和匿名的adhoc无线对等通信提供实时的私人位置为基础的建议。实验结果表明,该方法优于传统方法,208X. Wang,M.Nguyen,J.Carr等人/ICT Express 6(2020)204图五、在 R 中删除旧行的影响。最近提出的分散矩阵分解模型,在精度和消除用户地理图。虽然提供了技术上合理的隐私保护,该模型只是失去了微不足道的准确性相比,非隐私基准模型。CRediT作者贡献声明王希伟:概念化,方法论,验证,撰写初稿,撰写审稿编辑,可视化,监督,项目管理,资金获取。MinhNguyen:软件,验证,调查,写作-审查编辑。乔纳森·卡尔:软件,验证,调查,写作,评论编辑。崔龙银:软件,验证,调查,写作-审查编辑。Kiho Lim:概念化,写作-评论编辑。竞合利益作者声明,他们没有已知的可能影响本文所报告工作致谢我们感谢Marcelo Sztainberg博士(东北伊利诺伊大学)在研究过程中的不断支持和富有洞察力的建议。我们还要感谢Ian McNair(东北伊利诺伊大学)在数据预处理和聚类分析方面的贡献。这项研究得到了东北伊利诺伊大学研究社区基金的支持。引用[1] F. 里 奇 湖 罗 卡 奇 湾 Shapira , Introduction to RecommenderSystemsHandbook,in:Recommender Systems Handbook,2011,pp. 1-35。[2] J. Bao , Y. Zheng , L. 等 , 中 国 粘 蝇 D. Wilkie , M. Mokbel ,Recommendations inlocation-based 社 交 网 络 : A survey ,GeoInformatica 19(2015)525-565.[3] S. Badsha,X.伊岛Khalil,D. Liu,S.尼泊尔E. Bertino,隐私保护位置建议,在:2017年网络信息系统工程国际会议论文集,2017年,第100页。502-516[4] C. Chen,Z. Liu,P. Zhao,J. Zhou,X. Li,使用去中心化矩阵分解的隐私保护兴趣点推荐,在:2018年AAAI人工智能会议论文集,2018年,pp. 257-264。[5] A. Liu,W. Wang, Z. Li,G. 刘,智-地 Li,X. Zhou,X. 张先生,一个面向信任的兴趣点推荐的隐私保护框架,IEEE AccessSpec.Sect.Trust。Comput. 6(2018)393-404。[6] D. Yang,杨氏D. Zhang,Z. Yu,Z. Wang,A sentiment-enhancedpersonalized location recommendation system,in:Proceedings of the24th ACM Conference on Hypertext and Social Media,2013,pp.119比128[7] Y.刘德铭A.N. Pham,G. Cong,Q. Yuan,基于位置的社交网络中兴趣点推荐的实验评估,在:VLDB捐赠会论文集,第10卷,2017年, pp. 1010-1021[8] Y.科伦河贝尔角,澳-地Volinsky,推荐系统的矩阵分解技术,计算机42(2009)30-37。[9] Y. Wang,A.V. Vasilakos,Q. Jin,J. Ma,A Wi-Fi Direct based P2Papplicationprototypeformobilesocialnetworkinginproximity( MSNP) , in :Proceedings of the 2014 IEEE 12th InternationalConference on Dependency , Autonomic and Secure Computing ,2014,pp.283-288.[10] N. Aneja,S. Gambhir,在Android上使用Wi-Fi Direct的基于配置文件的临时社交网络,Mob。INF. 系统(2018年)1.[11] D.D.李,H. S.非负矩阵分解算法,Adv. 神经信息过程系统13(2001)556
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功