没有合适的资源?快使用搜索试试~ 我知道了~
数据科学与管理4(2021)40研究文章具有最小化交易数据的Yujeong Hwangboa,Kyoung Jun Leeb,*,Baek Jeongb,Kyung Yang Parkca韩国庆熙大学大数据研究中心,首尔,02447b韩国首尔庆熙大学大数据分析系,邮编:02447cHarex InfoTech,Seoul,02447,韩国A R T I C L E I N F O保留字:以用户为中心的支付推荐服务人工智能EX trapolative协同滤波A B S T R A C T本文讨论了所谓的以用户为中心的支付环境中的推荐系统,其中用户,即,付款人可以在不向商家提供自我信息的情况下进行支付该服务仅保留最低限度的购买信息,如购买的产品名称,购买时间,购买地点,以便可能退款或取消购买。本研究旨在利用以用户为中心的支付服务所产生的最小交易数据来开发基于人工智能的首先,我们开发了一种基于开放交易数据的基于矩阵的外推协同过滤算法。推荐方法已通过真实交易数据进行验证。基于实验结果,我们证实,推荐性能是令人满意的,只有最少的购买信息。1. 介绍许多公司希望通过引入人工智能(AI)系统来提高产品和服务质量,并提高生产力和销售额(Di X on et al., 2021年)。 公司试图积累更大量的用户数据,以提高AI系统的性能。然而,在收集如此大量的数据的过程中存在侵犯用户隐私的风险(Lee等人,2013年)。特别是医疗和金融行业的公司正在收集敏感的个人信息,当这些个人信息暴露时,这会产生重大问题。例如,2020年8月,处理亚马逊、Swiggy和MakeMyTrip等多家公司支付的Juspay在在线支付过程中泄露了超过1亿借记卡和信用卡用户的信息(Jain,2021)。已知泄露的数据包含有关用户姓名、联系信息、借记卡和信用卡的信息。 被劫持用户的信息被发现在暗网上出售。用户有权使用自己的数据,公司应该研究如何在不直接收集或获取用户数据的情况下使用用户数据在本文中,我们处理所谓的以用户为中心的支付环境,其中用户,即,付款人可以在不向商家提供自身信息的情况下进行支付。此服务维护最低限度的购买信息,如购买的产品名称,购买时间和购买地点,以便可能退款或取消采购. 本研究在以用户为中心的支付场景下,利用人工智能技术设计并实现推荐算法,并利用真实数据验证推荐服务2. 文献综述2.1. MyData作为以用户为中心的范例近年来,以用户为中心的结构主要从隐私的角度英国的DIGI.ME提供将个人数据存储在云中的存储服务。个人自己管理个人数据处理的整个过程,从收集到存储和共享其个人数据。 该服务扩展到管理各种类型的个人信息,包括医疗保健和财务信息。根据DIGI.ME的说法,这些服务提供了一个以用户为中心的架构,用户将所有数据加密存储在他们选择的云中,并拥有数据的唯一密钥,只有用户才能访问它。这些服务允许用户控制谁在共享他们的数据。这种举动类似于MyData的持续趋势MyData是指个人通过直接管理和控制自己的个人信息,在个人生活中积极利用数据的过程,如信用管理和资产管理。同行评议由Xi交通大学负责* 通讯作者。电子邮件地址:klee@khu.ac.kr(K.J. Lee)。https://doi.org/10.1016/j.dsm.2022.01.001接收日期:2021年10月13日;接收日期:2021年12月18日;接受日期:2022年1月7日2022年1月20日在线提供2666-7649/©2022 Xi'an Jiaotong University.出版社:Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表数据科学与管理杂志主页:www.keaipublishing.com/en/journals/data-science-and-managementY. Hwangbo等人数据科学与管理4(2021)40412.2. 以用户为中心支付Harex Infotech Co.,Ltd.是一家提供所谓UBpay服务的公司,该服务基于以用户为中心的支付平台。该公司服务的一个重要特点是,它不向商家提供个人的财务信息(Park,2020)。与现有的支付服务相比,这种支付将商家的ID传递到用户个人智能手机)。在大多数现实生活中,收款人将他们的账户信息发送给付款人以接收资金。然而,在传统的在线或在线支付环境中,诸如图1B中所示的旧模型。 1.用户将其财务信息(如信用卡数据)提供给商店,即使客户能够支付。这种情况是不可避免的,因为客户没有互联网网络和移动计算机(例如,智能手机)。但是现在客户拥有智能手机并可以访问互联网网络(3G/LTE/5G),一种新的支付方式是可能的(Lee等人,2006年、2016年)。以用户为中心的支付服务,已经由Lee等人进行了学术研究。(2006)智能手机普及之前。以用户为中心的支付服务不涉及中介机构,因此不仅降低了网络(VAN)费用和支付网关(PG)公司费用,还降低了个人信息泄露的风险 UBpay服务不会收集客户的人口统计资料或帐户信息。相反,该服务保留最低限度的购买信息,如购买的产品名称、购买时间、购买地点,以便退款或取消购买。 我们正利用以用户为中心的支付服务产生的最低支付信息开发人工智能服务。3. 方法3.1. 协同过滤协作过滤技术通常在项目推荐中表现出有效的性能(Sarwar等人,2000年)。协同过滤假设对某些产品具有相似偏好的用户也会对其他产品具有相似偏好换句话说,协作过滤意味着实现一个模型,根据用户之间的相似性预测用户的偏好。一种类型的协作过滤,基于用户的协作过滤,测量并推荐用户之间的相似性,而另一种类型,基于项目的协作过滤,推荐产品之 间的相似性( Boba-dilla 等人,2013; Sarwar等人, 2001年)。基于用户的协作过滤使用余弦相似性、皮尔逊相关系数和斯皮尔曼相似推荐产品。另一方面,基于项目的协同过滤测量用户对每个项目的偏好,每个项目的相似性,然后推荐产品。然而,在基于用户的协作滤波技术的情况下,随着用户数量的增加,随着相似性计算量的增加,出现了问题。基于项目的协作过滤用于解决这些问题(Ekstrand等人, 2011年)。协同过滤需要大量的数据来推荐产品。例如,电子商务网站,如亚马逊,只有少量的数据,用户已经创建相对于产品的数量 在这些情况下,缺乏识别偏好的数据造成了稀缺问题,使得很难做出适当的推荐(Papagelis等人,2005; Sarwar等人,2001年)。此外,在电子商务环境中,计算的日益增加的复杂性引起可扩展性问题(Sarwar等人,2000年)。一种可以解决稀缺问题的混合过滤方法已经出现,然后推荐可以为用户提供更高满意度的产品(Bobadilla等人,2012; Burke,2002)。混合滤波是一种使用不同模型进行更准确预测的技术协同过滤系统在多个领域均表现良好。然而,随着公司收集用户的个人信息,隐私问题正在发生。(Friedman等人,2015; Wang等人,2018年)。 为了解决这个问题,我们需要一种不使用用户信息的推荐方法(Sahoo等人, 2019年),我们提出了一个ECF算法。3.2. 外推协同滤波(ECF)ECF挖掘单个商户内与当前用户最相似的用户,向当前用户推荐相似用户购买的商品。 ECF方法允许用户探索其他类似用户,不仅考虑当前商家,还考虑其他商家的用户(Lee等人, 2021年)。特别地,ECF通过利用用户的基于行为的数据(诸如用户的购买项目、购买时间和内容观看历史)来提供推荐服务,而不收集用户的人口统计信息,从而保护用户隐私并实现适当的推荐。在这项研究中,我们为以用户为中心的支付情况实现了基于矩阵的外推协作过滤(M-ECF)首先,我们通过公开可用的事务数据预处理来实现需要通过真实的支付交易数据验证推荐服务在多商户情况下可用。 我们利用开发的M-ECF使用真实的UBpay数据来验证实际的推荐服务是可能的。Fig. 1. 旧模式vs.以用户为中心的支付。Y. Hwangbo等人数据科学与管理4(2021)4042n1/1图二. 基于矩阵X的外推协同滤波算法图.3.2.1. M-ECFM-ECF算法的目标是在向用户推荐产品时,通过考虑使用单个商家在这项研究中,通过扩展基于矩阵的协作过滤方法的M-ECF算法,我们希望确保单个商家只能通过购买历史信息进行推荐,而无需利用用户的个人信息(图)2)。在众多的推荐中产品-用户矩阵X(表1)。同样,我们利用购买时间和购买地点构造每个矩阵X,使用余弦相似度导出每个矩阵x,并通过三个矩阵的方法导出最终相似度矩阵X在建立购买时间矩阵时,我们考虑了一周中的天数和小时数,以详细确定用户随时间的购买倾向。我们还利用了梅桑的位置来建立场地矩阵。这使得能够选择更多相似的用户,因为它不仅探索首选产品,而且还比较购买时间和地点的模式。3.3. 相似性用户或项目之间的相似性在协作过滤中至关重要。 如果有用户购买了相同的 产 品 , 我 们 可 以 看 到 这 两 个用 户 具 有 相 似 的 购 买 模 式(Herlocker等人,2000年)。根据先前的研究,使用的常见相似性测量方法包括皮尔逊相关系数(Resnick等人, 1994)、Jumper相似性(Niwattanakul等人, 2013)和余弦相似性(Bobadilla等人, 2013年)。在这项研究中,我们使用余弦相似性。余弦相似度的公式如下:A·BPnA i B i1/1为了找到最相似的用户,我们希望通过基于矩阵的算法容易制造且性能良好的机器相似度和A;B相 似 度AB¼qPAi3.2.2. 建议方案该算法的推荐方案如下。首先,要实现基于用户的协同过滤,我们必须学习用户之间相似的购买模式。在这个实验中,我们建立了三个矩阵(购买的产品名称,购买的时间和购买的地方)与用户行为数据的推荐在以用户为中心的支付环境。我们最终整合三个矩阵,探索具有最相似购买模式的用户,并根据最相似用户得出并推荐购买的产品列表3.2.3. 基于用户的ECF对于公开的购买交易数据,我们假设每个商家处理的商品都有一个标准化的类别,然后基于该标准化代码构建一个矩阵在这项研究中,我们构建了一个矩阵X,其中标准化的产品类别成为用户购买数据中的一列,另一个矩阵X使用产品和用户购买的次数来构建其中,Ai和Bi分别是向量A和B的分量3.4. 评价矩阵本研究采用了基于准确性的评估方法,因为它是一个实验,用户实际推荐的产品购买。我们预测他们的购买选择;但我们并不预测用户的忠诚度,而是将所有用户最后购买的产品指定为标签值,并通过排除最后产品的用户购买记录推荐产品来衡量准确性为了评估所提出的算法的准确性,我们利用了点击率(HR)方法,这是广泛使用的前N推荐方法(Deshpande和Karypis,2004年)。N是用户总数,“点击数”表示用户实际购买的商品在推荐商品中。点击率的定义如下:点击率-¼ 点击量表1三种矩阵。用户X购买的产品购买地点/用户编号商家1商户2商人3商家4商人5…10100120…220000…300000…42549000….....................用户X购买购买次数/用户数太阳12-15太阳15-18太阳18-21SUN 21-24周一0-3…1103210…283200…344200…417900….....................用户X购买地点购买的产品/用户号A010101A010102A010103A010104A010105…110000…2140640…300000…4100200……………………1/1Y. Hwangbo等人数据科学与管理4(2021)4043表2按商家的数据描述商家商家商家商家总一BCD用户的数量5,6005,1214,1201,2245,833号的1,199,8191,711,4751,037,06328,4203,976,777采购产品类型63026249871454,386平均1,904.5652.21,050.7196.0906.7每种产品类型的采购量4. 使用公开可用的交易数据进行4.1. 数据描述在支付行业的情况下,存储用户的购买历史以提供各种支付支持服务,诸如可能的取 消 或 退 款 。 本 研 究 使 用 公 开可 用 的交 易 数 据(LotteMembers,2021)来开发M-ECF算法。这些数据由在韩国拥有3600万会员的乐天集团旗下综合会员服务L.POINT提供,是流通、食品、服务等各个消费领域的交易数据我们在数据中发现的各种类型的信息中,仅使用购买信息(购买的产品名称、购买时间、购买地点由于交易数据包括各种商家的支付细节,我们比较了每个单一商家情况以及多商家情况的推荐结果。交易数据包括来自四个不同商家的支付信息,并包括个人用户在2015年购买的产品的详细信息该数据包括5,833名用户,3,976,777笔付款和4,386种产品类型。如表2所示,当查看每个商家时,商家A具有最大数量的用户,而商家D具有最小数量的用户。 就支付次数而言,商家B的支付次数和产品类型最多,而商家D的支付次数和产品类型最少。总体而言,当考虑产品类型的数量时,与产品类型相比,商家A显示出最高的支付次数,因为产品类型的数量小于支付次数。5. 结果本节评估所开发的基于矩阵的ECF推荐算法的性能。比较了单商户和多商户情况下的推荐准确率。结果见表3和图4。 3. 单商户推荐情况仅使用每个商户A、B的用户购买信息表3单商户和多商户算法的比较商家A商家B商人C商人DTop-5前10前20Top-5前10前20Top-5前10前20Top-5前10前20单个13.7020.0028.905.908.5012.6010.4015.9023.4024.8034.3043.50多13.3019.9027.906.609.6013.1018.7023.1028.4045.8050.7052.90图3. 单商户和多商户算法的比较。Y. Hwangbo等人数据科学与管理4(2021)4044表4数据说明。用户的数量采购数量产品类型每个产品类型的6. 使用真实的支付交易数据进行我们测试了推荐方法在现实环境中是否表现良好。Ubpay 862 4,231 1,803 2.3表5比较Top-5、Top-10和Top-20。前5名前10名前20名Ubpay 39.79 40.95 41.53见图4。Top-5、Top-10和Top-20的推荐准确度比较。C和d多商家推荐的情况下,使用所有的用户购买信息作为一个整体。因此,确认除了商家A之外,大多数商家的单一商家的准确性更高的Mer-chant A,它有很多交易数据,但产品很少以商户B为例,多商户推荐准确率在Top10上较单商户推荐准确率提升1.1%这款车型在Merchant C和D的销量分别增长了7.2%和16.4%特别是,该模型显示出更高的推荐性能在多商家比单商家。 研究表明,当交易数据在单一情况下较小时,ECF系统具有更高的推荐性能。拥有少量数据的商家可以通过组合来自其他商家的数据并提供推荐服务来获得高6.1. 数据描述UBpay是一种以用户为中心的支付服务,拥有用户的购买信息(购买的产品,购买时间和购买地点)。用于算法开发的数据包括862个用户,4,231个支付案例和1,803个产品类型。产品类型的平均付款次数为2.3次(表4)。7. 结果表5和图 4给出了用UBpay数据验证基于矩阵的ECF算法的结果.推荐业绩在Top-5中为39.79%,在Top-10中为40.95%,在Top-20中为 41.53%为了测试UBpay服务的推荐的适当数量,在增加推荐产品的数量的同时检查准确性的变化,如图所示。 五、8. 结论8.1. 摘要和影响本研究的目的是检查在以用户为中心的支付环境中基于人工智能的推荐系统的可行性首先,基于公开的交易数据,提出了一种基于矩阵的ECF算法.推荐方法已通过实际用户支付数据进行验证多商户版本的推荐准确率显著高于单一商户版本。基于实验结果的启示如下。首先,它确认了只有用户的支付信息才能推荐,而不必指定客户是谁或他们的这项研究的结果表明,建议是可能的,对用户的最小知识。第二,通过基于矩阵的算法,即使在小数据环境中也可以开发推荐服务机器学习和深度学习中的大多数高级算法都需要大量的数据,并且在模型设计和实现中需要大量的成本,例如然而,我们的研究表明,通过实施基于矩阵X图五. Top-N的推荐准确度比较Y. Hwangbo等人数据科学与管理4(2021)4045算法8.2. 局限性和未来的工作这项研究有以下局限性。如果未来UBpay服务的数据量增加,则很难部署基于矩阵的推荐算法,每当有新用户出现时都需要进行计算。 这可能导致实时提供服务的限制。在未来的研究中,考虑到在以用户为中心的支付环境中数据点数量增加的情况有必要开发一种高级出租的推荐服务,该推荐服务能够实现基于矩阵的系统之外的实时推荐服务。竞合利益作者声明不存在利益冲突致谢这 项 工 作 得 到 了 韩 国 国 家 研 究 基 金 会 ( NRF2020K2A9A2A06069972,FY2020)管理的国际合作计划框架的支持,并得到了韩国教育部和韩国国家研究基金会(NRF)资助的BK21 FOUR(培养优秀研究型大学)的支持。这项工作得到了韩国教育部和韩国国家研究基金会(NRF-2020 S1 A5 B8103855)的支持引用Bobadilla,J.,Ortega,F.,Hernando,A.,Bernal,J.,2012.一种协作过滤方法,以缓解新用户冷启动问题。知道。基础系统2月26日 225- 238Bo badilla,J.,Ortega,F.,Hernando,A., Gut i'errez,A.,2013年。 推荐系统调查。知道。基础系统46(7月), 109比132伯克河,2002年。混合推荐系统:综述与实验。用户模型。用户自适应交互。 12(4),331- 370。Deshpande,M.,Karypis,G.,2004.基于项目的top-n推荐算法。ACMTrans.Inf.Syst.22(1),143- 177。迪吉,我,2021。以用户为中心的架构,通过设计实现隐私。https://digi.me/user-centric-architecture/(于二零二一年十二月十六日查阅)。迪克斯,J.,Hong,B.,吴,L.,2021.机器人革命:企业的管理和就业后果。经理。Sci. 67(9),5586- 5605。Ekstrand,医学博士,Riedl,J.T.,Konstan,J.A.,2011.协同过滤推荐系统。Found. 趋势Hum. Comput. 互动. 4(2),81- 173。Friedman,A.,B.P.,Vanhecke,K.,马滕斯湖Berkovsky,S.,2015.推荐系统的隐私问题。在:推荐系统手册。Springer,Boston,pp. 649- 688.Herlocker,J.L.,Konstan,J.A.,Riedl,J.,2000. E X解释协作过滤建议。2000年ACM计算机支持的协同工作会议论文集,pp。 241- 250Jain河,2021.为亚马逊和Swiggy处理支付的公司报告了超过1亿借记卡和信用卡持卡人的数据泄露。Business Insider印度可在。https://www.businessinsider.in/tech/news/over-100-million-debit-and-credit-card-users-data-has-been-leaked-online-from-payments-processor-juspay-amazon-and-swiggy/articleshow/80096472.cms.李,H.,Lim,D.,Zo,H.,2013.大数据时代的个人信息过载和用户抵触情绪。J. 内特尔INF. 系统 19(1),125- 139。Lee,K.J.,许先生Hwangbo,Y.J.,Jun,J.H.,2016年。 理解FinTech。J. INF.25(2),173Lee,K.J.,Hwangbo,Y.J.,Jeong,B.,J.W. Park,K.Y.,2021. E X trapolative协同过滤推荐系统与Word2Vec为中小企业采购产品. 可持续性13(13),7156。Lee,K.J.,Jeong,M.J.,Ju,J.I.,2006.无障碍和隐私增强了无处不在的支付。在:电子商务和网络技术国际会议论文集,页。 142- 151乐天会员,2021年。大数据竞争在:第三次会议的会议记录L.点。Niwattanakul,S.,Singthongchai,J.,Naenudorn,E.,Wanapu,S.,2013.使用Jaccardcoefficient计算关键字相似度。在:工程师和计算机科学家的国际会议论文集,1,pp。 380- 384.Park,K.Y.,2020.超连接的TRUST链共享网络和以用户为中心的新经济秩序。在:韩国商业通信协会2020年夏季会议论文集,pp。 9比35Papagelis,M.,Plexousakis,D.,Kutsuras,T.,2005.使用信任推理缓解协作过滤的稀疏性问题。在:国际信托管理会议,pp。 224- 239Resnick,P.,Iacovou,N.,Suchak,M.,Bergstrom,P.,Riedl,J.,1994. Grouplens:网络新闻协作过滤的开放架构。1994年ACM计算机支持的协同工作会议论文集,pp。175- 186。Sahoo,A.K.,Pradhan,C.,Mishra,B.S.P.,2019.基于奇异值分解的隐私保护推荐模型。2019年通信与信号处理国际会议。IEEE,pp. 294- 298.Sarwar,B.,Karypis,G.,Konstan,J.,Riedl,J.,2000.电子商务推荐算法分析。在:第二届ACM电子商务会议的会议记录,pp。 158- 167。Sarwar,B.,Karypis,G.,Konstan,J.,Riedl,J.,2001.基于项目的协同过滤推荐算法。在:第10届万维网国际会议的会议记录,pp。 285- 295.Wang,C.,中国地质大学,郑宇,姜杰,Ren,K.,2018.走向隐私保护的个性化推荐服务。Engineering 4(1),21- 28.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功