没有合适的资源?快使用搜索试试~ 我知道了~
基于大规模移动购物数据的跨平台消费者行为分析
跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1785基于大规模移动购物数据的跨平台消费者行为分析洪晃*华中科技大学中国武汉honghuang@hust.edu.cn复旦大学上海,中国14307130071@fudan.edu.cn王兴刚中国电信公司公司中国北京wangxingg@chinatelecom.cn薄昭Gesellschaft FurWissenschaftlicheDatenverarbeitung mbH Goettingen(GWDG)德国哥廷根bo. gwdg.de王振轩德国zxwang1497@gmail.com哥廷根大学海金华中科技大学中国武汉hjin@hust.edu.cn中国上海复旦大学haozhao14@fudan.edu.cn姚晓明中国电信公司公司中国北京yaoxm@chinatelecom.cn傅晓明德国fu@cs.uni-goettingen.de哥廷根大学摘要移动设备特别是智能手机的普及为工业界和学术界带来了巨大的机遇特别地,从用户的使用日志中产生的大量数据为利益相关者提供了借助数据挖掘更好地了解消费者行为的可能性在本文中,我们研究了跨多个平台的消费者行为的基础上,一个主要的电信运营商的大规模移动互联网数据集,该数据集覆盖了来自两个地区的980万用户,其中140万用户访问了电子商务平台在我们的研究的一周 我们做了几个有趣的观察和考试用户的文化差异,从不同的地区。我们的分析显示,在现有的多个电子商务平台中,大多数移动用户都忠于他们喜欢的网站;人们(60%)倾向于快速决定在线购买东西,通常需要不到半小时。此外,我们发现,人们在住宅区比在商业区更容易进行购买,购买发生在非工作时间。同时,中等社会经济地位的人喜欢在电子商务平台上浏览和购买,而高社会经济地位和低社会经济地位的人更容易在网上进行购买。我们还展示了跨平台购物的可预测性注1。H. Huang和H.Jin博士就职于华中科技大学服务计算技术与系统实验室/大数据技术与系统实验室。2. H. Huang和X.Fu为通讯作者。3. 部分工作是在H.黄博士就职于德国哥廷根大学本文在知识共享署名4.0国际(CC BY 4.0)许可下发布作者保留在其个人和公司网站上以适当的归属方式传播作品的权利。WWW 2018,2018年4月23日©2018 IW3C2(国际万维网会议委员会),在知识共享CC BY 4.0许可下发布。ACM ISBN 978-1-4503-5639-8/18/04。https://doi.org/10.1145/3178876.3186169行为与广泛的实验的基础上,我们观察到的数据。 我们的发现可能是一个很好的指导电子商务未来的战略制定。CCS概念• 应用计算→网上购物;法律、社会和行为科学;·信息系统→数据挖掘;·以人为中心的计算→无处不在和移动计算的实证研究;·计算方法学→机器学习;关键词移动使用,电子商务,消费者行为,数据挖掘,可预测性ACM参考格式:Hong Huang , Bo Zhao , Hao Zhao , Zhou Zhuang , ZhenxuanWang , Xiaoming Yao , Xinggang Wang , Hai Jin , and XiaomingFu.2018.大规模移动购物数据的跨平台消费者行为分析在WWW2018:2018年网络会议,2018年4月23日至27日,里昂,法国。ACM,NewYork,NY,USA,10页。https://doi.org/10.1145/3178876.31861691介绍随着智能手机和移动应用的发展,人们在移动设备上花费的时间越来越多根据最近的一项调查,近75%的美国成年人将在2017年使用智能手机平均而言,人们每天在移动终端1上花费3小时15分钟。2016年11月,移动互联网使用量甚至首次超过桌面使用量2.移动使用的激增已经塑造了我们的生活(例如,征服了我们的钱包),并极大地改变了许多企业的商业一项研究表明,大多数在线1http://www.geomarketing.com/us-mobile-usage-in-2017-stats-you-need-to-know2http://bgr.com/2016/11/02/internet-usage-desktop-vs-mobile/跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1786英国的购物销售现在通过智能手机和平板电脑进行,而不是传统的电脑或笔记本电脑3。移动设备的普及和移动使用产生的大量数据在以前由于缺乏足够的数据而难以探索更好地理解用户行为和潜在的使用模式可以允许移动服务提供商定义有效的营销策略,以吸引更多的用户并保持当前用户,最终增加其利润。一个例子是啤酒和尿布4的故事,它在分析超市消费者行为数据时提出了一种创新的营销策略 对于个人用户来说,更好地了解他们自己的时间行为模式可以帮助他们更好地规划自己的家庭预算,并更好地利用提供商的营销策略。随着网上购物平台的出现和不断增加,用户有更多的可能性在网上购物。他们可能会在不同的在线平台上寻找他们理想的产品,并考虑复杂的因素,例如好的价格,好的服务或销售。然而,由于缺乏数据的限制,以前的工作主要集中在单个电子商务平台的用户行为分析[31]。目前还不清楚人们是否会在不同的购物平台之间移动,甚至不清楚用户为什么以及如何从一个平台跳到下一个平台此外,用户的个人资料,如他们的文化,社会和道德以及他们所属的功能区域也会影响他们的研究人员更加关注用户分析[2,7,11,13,31]并将其应用于许多领域,例如个性化和推荐系统[1,15,19,25]。用户应用程序使用行为),他们的功能区和社会经济地位会影响他们的购物决定也将提供有用的见解。由于与智能手机相关的电子商务大数据,现在可以将单个用户在多个平台上的购物行为与大规模移动使用日志相关联,我们能够访问用户访问过的所有平台,尽管这也给我们在访问和处理数据时带来了挑战。例如,压缩的移动互联网数据使用记录的大小,包括1000万移动电话用户在一周内的活跃在线购物活动,可以很容易地超过40 TB,这是本文中使用的场景。本文以中国两个人口稠密地区的一家主要电信运营商的移动通信数据为基础,系统地研究了跨平台、跨地区消费者购物行为问题。 我们先回答以下6个问题:(1) 时空因素如何影响用户(2) 不同功能区用户购物行为的(3) 用户应用程序使用行为)和社会经济地位会影响他们的购物决策;http://www.telegraph.co.uk/news/shopping-and-consumer-news/12172230/Are-mobiles-changing-how-we-shop.html4https://www.theregister.co.uk/2006/08/15/beer_diapers/(4) 人们如何做出购物决定;(5) 用户是否表现出对某些购物平台的忠诚度(6) 用户的跨平台购物行为是否我们做了一些有趣的观察。例如,在现有的多种电子商务平台 中, 大 多 数 移 动 用 户 都 忠 诚 于 他 们 喜 欢 的 网 站 ; 人 们(60%)倾向于快速决定在线购买东西,通常需要不到半个小时。居住区居民更容易在非工作时间进行购物。此外,中等社会经济地位的人喜欢在电子商务平台上浏览和购买,而社会经济地位高和低的人更容易在网上进行购买。基于观察结果,我们进一步研究了跨平台购物行为的可预测性。我们建立了一个框架,四种类型的特征:时间特征,忠诚度特征,剖析特征和人口统计特征。 预测结果表明,消费者的跨平台购物行为是可预测的,我们的预测性能在F1和准确率方面都高达94%。本文其余部分的组织结构如下。第2节介绍了我们研究中使用的数据集第三部分研究时空因素如何影响用户第4部分确定用户的购物行为是否第5节显示用户的个人资料是否会影响他们的购物决定。第六节探讨了用户的购物决策行为。第7节研究了不同购物平台的用户忠诚度。第8节介绍了我们的预测框架和预测结果,第9节给出了相关的工作。第10节结束。2数据集数据收集。 该数据集来自中国三大移动电信运营商之一提供的蜂窝环境中的移动使用的匿名浏览记录的日志。它包含来自两个人口稠密地区的超过9,700,000名用户在大约一周的时间内的移动使用数据:一个是上海,世界上人口最多的大都市(也是中国大陆的商业和金融中心),2016年4月20日至4月26日,另一个是山东省,中国第二大人口省份。人均可支配收入仅为上海5的45%,时间为2016年8月6日至8月14日。这些记录中的每一个都包含移动终端的匿名ID和每个动作的开始时间,以及浏览记录。这些记录的一部分包含以执行动作的经度和纬度形式的地理位置数据预处理。所收集的数据是异构的并且吵了. 为了利用这些庞大的移动浏览记录来研究消费者行为,我们需要从清理数据开始。我们分析了5个最流行的中国B2C电子商务平台,它们是淘宝(taobao.com)、京东(jd.com)、苏宁(ing.com)、当当(dangdang.com)和唯品会(vip.com)。我们专注5http://www.yicai.com/news/5229761.html跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1787山东工作日上海工作日山东周末上海周末山东省山西省山东工作日上海工作日山东周末上海周末0.150.100.050.000 8小时16小时24小时(a) 两个区域的浏览率43210.160.120.080.040 8小时16小时24小时(b) 两个地区的购买率0.50.40.30.20.1平台的影响力我们主要关注中国最受欢迎的5个B2C电子商务平台。在这里,我们将分别研究用户在每个平台上的购物行为。图图1(c)和(d)示出了用户从图1(c)中,我们可以看到淘宝和京东是最受欢迎的平台,这是中国最大和最全面的两个在线购物平台,占我们数据集浏览记录的74.0%和购买的93.9%。有趣的是,我们发现人们更愿意在淘宝和VIP,如图所示第1段(d)分段。地区的影响。从图1(a)中,我们可以看到,不同地区的人倾向于具有相似的浏览行为。然而,他们在购买时的反应却截然不同从图1(b)、0淘宝京东苏宁VIP Dang(c) 浏览率与平台0.0淘宝京东苏宁VIPDang(d) 采购比率与平台我们可以看到上海的用户比山东的用户更倾向于进行网上购物。这可能是因为欠发达地区的人更关心图1:时空因素如何影响用户(a)和(b)分别示出了两个区域中的浏览和购买比率,其中X轴是一天中的小时,Y轴是浏览或购买比率,其中比率表示一小时内的购买占一天内的总浏览次数的百分比。(c)和(d)示出了不同平台上的浏览和购买比率,其中X轴单位是不同平台,Y轴是浏览或购买比率。请注意,为了使图更具可读性,在(c)中,我们将Y轴设为loд 10(实际浏览率*10000)。在这些平台上浏览或购买的所有用户,并提取所有浏览和购买记录。 由于各种平台上的Web服务请求和响应查询的多个交互轮次,需要从许多冗余交互记录中识别单个浏览或购买动作。 为了简单起见,我们只计算了一次页面访问。在消除冗余记录后,我们获得了386,379条唯一的浏览和购买记录。 详细数据统计见表1。3时空因素如何影响用户购物行为?在这一部分中,我们将研究时空因素(例如,时间、区域和平台)影响用户的购物行为,即,产品浏览或购买。时间的影响 人们通常有不同的时间表上不同地区的工作日和周末图图1(a)和图1(b)分别示出了用户从图1(a),我们可以看到人们在工作日和周末都倾向于有类似的浏览行为。例如,山东和上海的人都愿意在早上的咖啡休息时间浏览购物网站10:00左右)。此外,人们更喜欢在工作时间(8:00在购买行为方面,人们更愿意在上午11点左右支付订单,这正好是大多数人浏览网页的时间之后。更重要的第1段(b)分段。花他们辛苦赚来的钱此外,上海消费者倾向于在深夜或凌晨进行购买,而山东消费者则相反,这可能反映了上海作为中国商业和金融中心的社会经济状况。4不同功能区用户现代文明和城市化促进了城市的功能区[30],人们在不同的区域表现不同 在本节中,我们将检查用户的购物行为是否在功能区中有所不同。本文将城市划分为商业区、居住区、休闲区和其他四类功能 由于我们只有用户的地理位置,因此我们确定这些功能根据与这些位置相关联的兴趣点(POI)的区域6. 与每个功能区相关的POI标签如表2所示。我们现在检查用户从图2中可以看出,商业区的人们进行浏览和购买活动的次数最多然而,人们在住宅区大多喜欢作出购买决定。这部分是因为在商业区,人们更有可能在蜂窝环境中访问电子商务平台,从而拥有更多的浏览和购买记录。然而,人们更容易在住宅区做出购买决定。用户下班时间。在此外,我们还对用户我们根据他们的工作状态将一天分为工作时间和下班时间(即,上午9点至下午6点为上班时间,其余为下班时间)。 从图3中可以看出,商业区的人在工作时间的浏览和购买活动更多,而住宅区的人在下班时间的购买活动更多,这与我们的直觉非常吻合。用户的购物行为与社会经济地位。在这第二部分,我们检验了用户的社会经济地位是否会影响他们的购物行为。”Socioeconomic status is the6POI数据集在链接http://pan.baidu.com/s/1pKCL6YZ。山东省山西省跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1788工作时间下班工作时间下班百分比百分比表1:数据集统计项目山东上海时间段2016年8月6日-8月14日 2016年4月20日-4月26日#移动用户5,461,2444,309,914每天平均用户数2,827,7712,914,294#网上购物301,426233,537#平均每天购物者45,48147,579#购买者33,18935,041#每天平均购买人数3,9705,454#浏览记录156,019135,154#每天的平均浏览记录17,33519,308#购买40,75354,453#每天平均购买量4,5287,7790.8 0.8 50.7 0.740.6 0.60.5 0.530.40.30.420.30.20.10.210.10商务住宅休闲其他0商务住宅休闲其他0商务居住休闲其他(a) 浏览(b) 购买(c) 购买/浏览图2:用户在4个功能区的购物行为(a)浏览行为;(b)购买行为;(三)购买比例。0.8 0.8 60.7 0.750.6 0.640.5 0.50.4 0.4 30.3 0.320.2 0.210.1 0.10商务住宅休闲其他(a) 浏览0商务住宅休闲其他(b) 购买0商务住宅休闲其他(c) 购买/浏览图3:用户在工作时间的购物行为与4个功能区的下班时间。(a)浏览行为;(b)购买行为;(c)购买比例。表2:基于POI的功能区的识别区POI标签业务政府;教育;医院;公司;等等居住城镇;村庄;别墅;房地产;等等。休闲酒店;体育;风景;餐厅;购物;等等。其他他人个人或团体的地位或等级它通常被测量为教育、收入和职业的结合”[28]。然而,由于隐私的原因,很难将个人的教育,收入和职业信息映射到网上购物数据中。因此,我们使用与用户的居住地址(地理位置)相关联的房价77房价爬自链家(lianjia.com),中国最著名的房地产中介平台之一10- 310- 3下班时间百分比百分比跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1789比100001000.04900080007000600050004000300020001000900.035800.03700.0256050 0.02400.015300.01200.005100低介质高0低介质高0低介质高图4:用户他们的社会经济地位。我们把人们的社会经济地位分为三类:高、中和低,其在x轴中示出。左:浏览行为;中:购买行为;右:购买的比例。大致分为高、中、低三类8.图4显示了结果。从图中可以看出,中等社会经济地位的人喜欢在电子商务平台上浏览和购买,而高社会经济地位和低社会经济地位的人5用户的应用使用行为重要吗用户对智能手机上的应用程序的使用通常,用户的应用使用行为可以很好地剖析和表征用户。 在本节中,我们将研究用户的应用程序使用行为是否会影响他们的购物决策。我们将首先对所有用户的应用使用行为进行分类人们经常使用哪些应用程序?根据Nielsen9的一份报告,用户在智能手机上花费的大部分时间(84%)只有5个非原生应用程序。这五个应用程序将因人而异并显示该用户的个性对于一些用户来说,他们的前五名可能包括社交媒体或游戏,而其他人可能会在即时消息中花费更多时间。为此,我们使用一个用户最常用的五个应用程序来分析他的应用程序使用行为。然而,由于数据可用性的限制,我们无法直接知道人们正在使用哪些应用程序与用户的移动访问记录,根据现有的信息有关的网址访问的域名因此,我们需要首先解析这些带有域名的记录,以便了解人们正在使用的应用程序。我们总共从12,385名移动用户那里获得了8,898个不同应用程序的唯一域名然后我们将这些域名聚类为8价格低于4万CNY/平方米为低,高于7万元/平方米为高,其他为中。9https://techcrunch.com/2015/06/22/consumers-spend-85-of-time-on-smartphones-in-apps-but-only-5-apps-see-heavy-use/图5:用户的应用程序使用行为与他们的购物决策之间的相关性X轴:总体病例和三个类别。Y轴:采购百分比。在Levenshtein距离[17]下使用DBSCAN方法[ 8 ]的几个集群。8,898个域名被聚类为393个簇。然后,我们根据中国最大的移动应用程序商店之一小米应用程序商店中的应用程序名称手动标记这些集群。通过这种方式,我们可以从人们的移动互联网使用记录中获取他们使用的应用程序用户购物行为。基于根据应用以人为本的应用代表了服务于人们日常生活中基本需求的应用,和面向实用的应用程序用于实用的角度,如“旅行”和“摄影”,而面向娱乐的应用程序包括休闲应用程序,如“游戏”。然后,我们检查人们的应用程序使用行为是否由于京东和淘宝是中国两大网购平台,我们只考虑用户的应用使用行为与他们在这两个平台上的购物决策之间的相关性图5显示了结果。从这个图中我们可以看出,偏好人性化APP的用户,由于更关注“购物”,更倾向于在线购买商品6一个用户需要多长时间才能做出购买决定在这一部分,我们想集中讨论“.为了简单也就是说,用户只有在结束最后一次购买之后才开始新的购买 根据我们的观察,超过96%的购买需要不到4天的时间进行,所以我们专注于每次购买前的4天时间段。我们把时间段分成几个时间段,Number跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂17900.40.30.20.10.00.310个月2小时16小时96小时(a) 淘宝上的山东用户0.50.40.30.20.10.00.310个月2小时16小时96小时(b) 山东用户在JD表3:用户类型类型ID类型名称百分比我快速购买者百分之六十一点二II犹豫用户21.93%III短期决策者9.53%IV长期决策者7.24%第11章0.20.20.50.50.1 0.10.010分钟2小时16h96h0.010分钟2小时16h96h010个月1小时12小时60小时96小时010个月1小时12小时60小时96小时(c) 上海淘宝用户(d) 京东上的上海用户(a) I型1(b) II型1图6:一次成功购买需要多少时间?X轴:时间范围{0-10m,10m-30m,30m-1h,1h- 2h,2h-4h,4h-8h,8h-16h,16h-32h,32h-64h,64h-96h}; Y轴:浏览率。即{0-10m,10m-30m,30m-1h,1h-2h,2h-4h,4h-8h,8h-16h,16h-16h-16h0.5010个月1小时12小时60小时96小时(c) III型0.5010个月1小时12小时60小时96小时(d) IV型32h,32h-64h,64h-96h}。然后,我们观察了用户 在这项研究中,我们只考虑最大的两个购物平台-淘宝和京东。是时候做决定了。 图6显示用户在每一个时间段。 从图中我们可以看到,人们在淘宝上购物时,会频繁地访问购物页面,这是在每次购买前不久。 如果一个用户只在他最终购买之前不久浏览产品页面,而没有任何先前的访问,我们可以说他是快速购买者,因为他通常花很少的时间考虑购买。然而,在京东购物时,山东用户倾向于快速做出决定,而上海用户则倾向于花更多时间考虑他们的购物购买。具有相似购物决策行为的人群。 我们知道有些用户会很快进行购买而其他人需要更多的时间来考虑他们的购买。对于卖家来说,这些信息可以帮助他们进一步制定更个性化的营销策略。根据我们的观察,消费者倾向于更频繁地访问网页,越接近他最终购买。为了更紧密地探索该特征,我们将4天时间段以指数增加的方式划分36h、36h-48h、48h-60h、60h-72h、72h-84h、84h-96h}。根据每个时间段内的这些浏览行为,我们可以将用户分为几个组。我们使用K-谱质心(K-SC)聚类算法[29]并将聚类数设置为4。图7说明了这些群集。如图所示,绝大多数用户倾向于在最终购买之前访问选定的页面30分钟这是有道理的,因为我们经常在下最终订单之前检查产品的状态四类用户如下:图7:基于浏览行为的四种类型的用户的图示。X轴:时间范围{0- 10 m,10 m-20 m,20 m-30 m,30 m-40 m,40 m-50m,50 m-1h,1h-2 h,2 h-4 h,4 h-6 h,6h、12h、12h-18h、18h-24h、24h-36h、36h-48h、48h-60h、60h-72h,72h-84h,84h-96h}; Y轴:浏览率。(a)快速购买者;(b)犹豫不决的使用者;(c)短期决策者;(d)长期决策者。类型I-用户在购买前浏览页面的时间不超过30分钟。我们将这些用户称为快速购买者。超六成用户是这样的“快购族”。II型我们将这些用户称为第三我们将这些用户称为“第四类用户在所有4种类型中,快速决策者构成了最大的群体,约占用户的60%,其次是犹豫不决的用户,约占消费者的20%其余20%的用户属于其他两种用户类型。表3总结了这四个用户群及其分布。7消费者忠诚吗?许多用户选择访问他们喜欢的购物平台并且不想尝试其他平台,而其他用户将在不同的平台上移动以搜索最佳交易。如果用户持续访问他们首选的购物平台,我们将这些用户称为忠诚用户。 在本节中,我们将回答“用户是否对某些购物平台忠诚,忠诚到什么程度?“.也就是说,用户在多大程度上使用同一个购物平台跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1791表4:前12种行为模式0.70.60.50.40.30.20.1以及它们在多大程度上跨越不同的平台01 2 3 4 5寻找最好的交易?人们通常在购买时会做什么 根据用户的购物行为,可以识别在购买期间发生的多个行为模式。与传统的频繁模式挖掘场景不同,在传统的频繁模式挖掘场景中,一个交易中的每个项目可能只出现一次,在线购物行为往往会重复自己。例如,用户在淘宝上购物前,在淘宝上浏览20页,在京东上浏览10页挖掘具有重复项的频繁模式使得该问题的分析更加复杂。利用EFIM(高效高效用项集挖掘)算法[32],一种在线性时间以低内存进行频繁模式挖掘的扩展问题之一的有效解决方案,我们能够发现高效用项集(即,一组物品)在我们的移动购物交易数据中包含效用信息。效用信息通常是指每个项目的数量和单价在这种情况下,我们将浏览和购买行为视为具有数量的物品,并且每个物品的单价相同。这意味着,可以确定最经常发生的多个行为模式。表4示出了结果。我们列出了用户倾向于表现出的前12种行为从表中我们可以看到,大多数用户仍然在同一个平台上,这表明了对某些购物平台的一定忠诚度。此外,一些用户会浏览购物页面而不购买任何东西,尤其是在京东和淘宝上。 还有很多用户在多个平台上浏览页面,以选择最好的产品。用户对购物平台忠诚吗? 由于众多的网上购物平台的存在,人们现在有多种选择,要么会选择不同的购物平台,由于图8:具有跨平台行为的用户分布。X轴:用户访问过的平台数量Y轴:百分比。忠于购物平台。但对这些平台的忠诚度仍是未知数。为了回答这个问题,我们将尝试建立一个模型来计算用户Oliver [21]将品牌忠诚度定义为“因此,根据这个定义,我们在整个过程中考虑两种类型的忠诚。首先,用户在每次购买之前,用户可以自由浏览任何平台上的页面。浏览忠诚度是指用户是否将仅浏览单个平台以进行购买,或者用户是否可以跨不同平台移动以搜索最佳交易。其次,用户在所有购买行为中的购买忠诚度,也就是说,用户是否会在同一个平台上购买产品,或者用户是否会在不同的平台上购买商品,例如第一次在淘宝上购买,然后在京东上下单。为了对用户的浏览忠诚度进行建模用户在购买期间访问的页面 我们将pin表示为用户正在平台i上浏览购买n的概率,而pi可以直接从用户的浏览历史计算。 关于用户的购买忠诚度,我们将q i表示为用户在平台i上购买的概率。因此,我们可以将用户对购物平台的忠诚度L定义如下:1 .一、NNn=1用户会使用多少个购物平台来回答用户是否忠诚于购物平台的问题。从图8中我们可以看到,约67%的用户在一周左右的时间只访问过用户对购物平台的忠诚度如何从从前面的小节中,我们知道在某种程度上用户是其中n表示第n次购买,N是购买的总数i是用户在其上进行购买的平台例如,如果用户有两次成功购买,他在淘宝上进行了第一次购买,在京东上进行了第二次购买。第一次购物,他一共浏览了10个购物页面,其中在淘宝上浏览了2个页面第二次购买,他也在京东上浏览了10页和4页所以他的忠诚度是1/2 *(0。5* 0。2+ 0。5* 0。4)= 0。15.百分比到复杂的原因,如不错的价格,良好的服务和销售或只是停留在一个平台。这里我们将从分布来看L=qi pin(行为模式1京东_浏览2JD_browsing,JD_purchasing3淘宝_浏览,淘宝_购买4淘宝_浏览5苏宁--浏览 苏宁易购6VIP_浏览7苏宁_浏览8淘宝_浏览,京东_浏览9淘宝_浏览,淘宝_代购,京东_浏览10VIP_browsing、JD_browsing11Vip_browsing, VIP_采购12苏宁_浏览、京东_浏览跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1792(()下一页精确度精确召回F1我们考虑两种极端情况来验证我们的模型。在第一种情况下,我们假设用户对一个购物平台非常忠诚,并且他在同一个平台上进行所有的浏览和购买他的忠诚度是1。在第二种情况下,我们假设用户在上述平台上进行了5次成功购买。每次购买,他都会浏览10页,但在他购买的平台上只有1页忠诚度为0。20 10. 2 5 = 0。02,这是相当低的。这证实了我们的假设。根据忠诚度的定义,我们计算所有用户我们发现,超过99%的用户忠诚度大于0.99。8消费者购买行为的可预测性实验设置。在本节中,我们将探讨消费者的购物行为是否是可预测的。从前面的章节中,我们已经知道大多数用户都忠诚于他们访问的平台。我们可以看到图。8,约67%的用户只访问过一个平台。换句话说,如果我们假设一个用户会选择使用最频繁访问的平台,我们可以获得预测性能,准确率至少达到67%。消费者行为是否可以更好地预测?在本节中,我们利用前面几节中学习到的导致消费者购买的特征我们的问题可以用以下方式形式化:给定一批在“淘宝”、“京东”、“当当”、“苏宁”、“VIP”等购物平台进行过扫描或购买的用户,我们有他们所有过往的浏览和购买记录,我们的目标是预测该用户下次会使用哪个平台来使他的购买?10.90.80.70.60.50.40.30.20.10表5:实验参数设置人口统计分析忠诚度时间为了在我们的数据集中解决这个问题,我们从Apr中提取了超过65,000个用户的2016年8月20日2016年14日。 在消除没有购买或只有一次购买的记录后,我们得到一个包含12,384个用户的102,517条记录的样本数据集。我们随机选择所有用户的一半作为训练和验证集,这揭示了表5中所示的最合适的实验参数。然后,我们使用剩下的一半用户作为测试数据集。也就是说,对于所有实验,训练集中有6,192个用户,测试集中有剩余的6,192个用户我们使用Weka和Tensorflow来训练和预测,使用以下算法:J48(C4.5),RandomForest,NaiveBayes,SVM和长短期记忆(LSTM)网络。所有实验都在运行ubuntu 16.04的PC上进行,该PC具有Intel Core i5 CPU 2。8GHz和8GB内存。功能. 在我们的模型中使用的特征是基于前几节的观察结果。它们可以概括如下,可以分为四种类型的功能。时间功能:我们建立一个时间特征来显示时间相关性。在实践中,我们将一天分为三个时间段:睡眠时间(上午1点至上午9点),活动时间(上午9点至下午5点)和业余时间(下午5点至凌晨1点)。然后将用户图9:因子贡献分析。X轴表示我们在预测框架中考虑的四种类型的特征Y轴表示预测性能。忠诚度功能:我们构建了一个忠诚度特征如下方程。(1)如第7节所述。分析功能:我们提取最常用的应用程序来分析用户的使用行为,并将其用作分析功能。在实践中,用户的使用行为被分为三类:以人为本,以实用为导向,以娱乐为导向。人口统计功能:我们将用户预测性能。预测结果示于表6中。正如我们所看到的,所有测试的算法都表现出类似的性能,F1得分高于0.9,这表明消费者的跨平台购物行为是可预测的,我们的预测性能是合理的我们研究了四种类型的特征的贡献,并分别检查每个特征的预测能力。图9显示了结果。从图中可以看出,时间特征具有最强的预测能力。算法参数设置J48置信因子C =0.5实例叶M = 20randomForest树= 100每个树的特征= 6NaiveBayes默认SVM成本=256伽马=0.00048LSTM学习率= 0.02神经元数量=256批次大小=50损失函数= Softmax交叉熵优化器= Adam优化器跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1793表6:预测性能算法精度召回F1精度J480.9820.9780.9790.978randomForest0.9800.9800.9800.979NaiveBayes0.9440.9430.9430.942SVM0.9750.9750.9750.976LSTM0.9740.9740.9740.9779相关工作在过去的几年里,手机经历了显著的发展和爆炸式的普及[22]。与此同时,电子商务也蓬勃发展,并彻底改变了传统的商业关系,以及快速增长的网上购物者的购物过程[3]。有了智能手机在手,消费者可以检查产品的详细信息,比较各种电子商务平台的价格,将商品保存到图表中,并享受许多好处,如商家的个性化和社交网络的推荐[4,10,16,31]。在信息爆炸的时代,用户的在线行为的复杂性了解消费者购买过程可以在消费者营销策略的成功和失败之间产生差异[26]。在此基础上,电子商务企业可以通过提高服务质量来保持竞争力。有大量的工作调查因素,有助于成功的购买结果,如动机[20]和demographics(例如。性别、年龄和居住地)[12、14、23、24]。一个重要的研究问题是从多个数据集中识别消费者早期的研究主要集中在确定网络搜索目标,以获得商业信息。Dai等人[6]关注用户当用户提交查询或浏览网页时,他/她是将要进行商业活动还是正在进行商业活动,例如采购、拍卖、销售、付费服务等。Guo等人[9]提出了一种用于检测搜索者意图的改进方法Guo等人[10]研究了社交网络和消费者行为之间的关系,以了解个人的商业交易是如何Zhang等人[31]对用户的Facebook个人资料信息如何与他们在eBay上的购买相关联进行了广泛的分析以往的研究大多只关注单一的电子商务平台[31]。然而,用户通常选择在各种电子商务平台之间移动以比较质量、价格和服务等。做出最好的选择[27],这一点移动数据集的急剧增加为识别消费者的购买意图和建模他们的行为提供了新的一个相关的工作是[18],其中Caroline等人进行了一项大规模的跨平台纵向研究。用户购买意图及其演变。更具体地说,作者试图了解导致在不同平台上成功购买的消费者行为。然而,由于他们使用的数据集完全基于Pinterest(一种允许用户在Pinterest上分享购物水果的内容发现应用程序),而不是真实世界的电子商务平台,因此他们的研究可能无法直接反映用户的购物行为,因此反映了有偏见的结果,因为不是每个人都愿意与他人分享他的所有购物行为和水果。此外,用户研究人员更加关注用户分析[2,7,11,13,31]并将其应用于许多领域,例如个性化和推荐系统[1,15,19,25]。在本文中,我们还将考虑用户的应用程序使用行为是否据我们所知,我们的研究是第一个深入研究不同电子商务平台上的真实消费者行为,以识别用户的商业意图和购买模式的研究。我们以电信移动使用数据作为我们的源数据集,其中包括用户购物平台使用的全面记录通过分析这些数据,我们能够分析用户第十章结论在本文中,我们进行了全面的研究,跨平台的移动购物行为,使用真实世界,大规模的移动数据集。我们发现,大多数人都忠于他们访问的购物平台,他们不会跨平台选择他们想要购买的商品。此外,大多数人都是快速购买者,他们在第一次浏览购买物品此外,我们从本文中学习到的模式,研究了用户在多个平台上的购物行为的可预测性这些发现可以为未来的电子商务战略提供有用的见解。据我们所知,这是第一个深入研究跨平台消费者行为的工作。未来的研究可以分析用户致谢本工作部分得到了国家重点研究发展计划项目(项目编号:2016QY02D0302)和国家自然科学基金项目(项目编号:61433019和项目编号:U1435217)的支持引用[1] Gediminas Adomavicius和Alexander Tuzhilin。1999.通过规则发现和验证在个性化应用程序中进行用户分析。第五届ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM,377[2] Nilanjan Banerjee,Dipanjan Chakraborty,Anupam Joshi,Sumit Mittal,Ang-Shu Rai和Balaraman Ravindran。2012年。对分析微博客的实时意图检测和分类。在ICWSM。[3] Steven Bellman,Gerald L Lohse,and Eric J Johnson.一九九九年。在线购买行为的预测者Commun. ACM 42,12(1999),32-38.[4] 马克·布朗奈杰尔·波普和凯文·沃格斯2003.购买还是浏览?购物倾向与线上购买意愿之探讨European Journal of Marketing37,11/12(2003),1666跟踪:行业WWW 2018,2018年4月23日至27日,法国里昂1794[5] 程丽晶,范涌泉,俞春,杜亚军。2016年。一种改进的信任感知推荐系统在 天 猫 的 个 性 化 用 户 推 荐 。 DEStech Transactions on Engineering andTechnology ResearchICMITE2016(2016).[6] Honghua Kathy Dai , Lingzhi Zhao , Zaiqing Nie , Ji-Rong Wen , LeeWang,and Ying Li. 2006.在线商业意图检测。在第15届万维网国际会议上。ACM,829-837。[7] Xiao Ding,Ting Liu,Junwen Duan,and Jian-Yun Nie. 2015.基于领域自适应卷积神经网络的社交
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功