没有合适的资源?快使用搜索试试~ 我知道了~
1http://www.e-unwto.org/doi/pdf/10.18111/97892844181452https://www.instagram.com3https://www.ickr.com4http://blog.euromonitor.com/2016/01/top-100-city-destinations-ranking-2016.html11900威尼斯通过Instagram的镜头0威尼斯旅游的视觉叙事0Luca Rossi阿斯顿大学伯明翰分校,英国l.rossi@aston.ac.uk0Eric Boscaro意大利威尼斯大学eboscaro90@gmail.com0Andrea Torsello意大利威尼斯大学torsello@unive.it0摘要0过去十年中,社交媒体在提取人类行为数据方面取得了巨大的发展。虽然元数据和文本信息在社交媒体分析中占据了主导地位,但带有地理标签的基于图像的平台代表了一个前所未有的、几乎未被开发的数据来源,可以分析人类行为并描述我们所生活的物理空间。在本文中,我们研究了使用Instagram照片分析旅游消费的方法。我们以意大利威尼斯市作为案例研究,并收集了2014年1月至2015年12月之间约9万张照片的数据集。利用计算机视觉技术,我们构建了一个监督分类器,将每张照片分配到六个不同的类别中。然后,我们观察这些类别的频率和空间分布如何随时间变化。这进一步使我们确认了与不同事件相关的一些旅游热点的存在,例如威尼斯狂欢节和双年展。我们的分析还揭示了与这些事件相关的旅游流量的存在,例如在狂欢节期间标记着游客从“Santa Lucia”火车站到“SanMarco”广场的“民俗线”。总的来说,我们的研究结果证实了使用Instagram数据研究旅游消费的提议框架的有效性。0关键词0社交媒体分析;城市信息学;Instagram0ACM参考格式:Luca Rossi,Eric Boscaro和AndreaTorsello。2018。威尼斯通过Instagram的镜头:威尼斯旅游的视觉叙事。在WWW'18Companion:2018年网络会议伴侣,2018年4月23日至27日,法国里昂。ACM,纽约,美国,8页。https://doi.org/10.1145/3184558.319155701 引言0旅游业是世界上许多国家增长最快的行业之一,根据联合国世界旅游组织的数据,2015年国际旅游者到达量超过10亿人次[1]。游客们渴望与他人分享他们的经历。0本文发表在知识共享署名4.0国际许可证(CC BY4.0)下。作者保留在个人和公司网站上传播作品的权利,并附上适当的归属。WWW'18Companion,2018年4月23日至27日,法国里昂。©2018IW3C2(国际万维网会议委员会),根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.31915570越来越多的人开始使用像Instagram和Flickr这样的照片分享社交媒体[4,8]。因此,这些平台吸引了越来越多的研究人员的兴趣,他们希望研究和了解旅游业[7-9]。在本文中,我们提议使用从Instagram收集的图片来研究意大利威尼斯市的旅游消费。意大利是2015年全球第五大热门旅游目的地[1],而威尼斯一直被列为意大利最受欢迎的城市之一[4]。我们收集了2014年1月至2015年12月之间拍摄的9万张照片,并设计了一个简单但有效的监督分类框架,将它们自动分配到6个不同的类别中。我们研究了这些类别的时间和空间分布,并发现:0•拍摄的照片数量在观察期内增加,主要在威尼斯狂欢节、威尼斯电影节和双年展等重大事件期间达到高峰;•约25%的照片是关于建筑元素的,如桥梁、教堂、广场,突出了威尼斯丰富的建筑遗产。然而,每个类别中的照片比例随时间变化,显示出明显的依赖于艺术展览和民俗节日等事件的特点。例如,我们观察到在狂欢节期间与威尼斯民俗相关的照片的频率显著增加(17%,而狂欢节之后的时期为14%);•照片的空间分布与相关场所的功能密切相关。例如,我们发现大多数艺术作品的照片位于著名的艺术场所,如双年展场馆;•威尼斯面具和其他与威尼斯民俗相关的物品的照片主要分布在“民俗线”上,这是一条直线路径,连接着威尼斯的“SantaLucia”火车站(威尼斯的主要入口之一)和“SanMarco”广场,经过“Rialto”桥(与“SanMarco”广场一起,是威尼斯面具密度最高的地区之一)。这种效应在狂欢节期间尤为明显。0据我们所知,这项工作是首次尝试使用基于图像的社交媒体对旅游进行自动化时空分析。我们相信,这样的框架可以在多个领域应用,从城市规划到市场营销和旅游行业。特别是,我们设想0研讨会:第八届位置与网络国际研讨会WWW 2018,2018年4月23日至27日,法国里昂5https://www.instagram.com/developer/11910(a)泻湖0(b)城市风景0(d)民间传说0(e)食物0(f)其他0图1:本研究选择的六个类别(泻湖、城市风景、艺术、民间传说、食物和其他)的样本照片。我们收集了2014年1月至2015年12月之间拍摄的总共9万张照片。0使用类似的分析方法来理解特定地理区域的旅游消费,并支持市场营销活动以及一般旅游投资的可能性。本文的其余部分组织如下:第2节回顾相关工作,第3节描述数据集及其收集情况。第4节介绍和评估本文使用的图像分类框架,而第5节和第6节则介绍主要发现并讨论我们研究的局限性。最后,第7节总结本文。02 相关工作0越来越多的大规模数据集从用户的在线活动中生成,这引发了对建模和理解人类行为的研究的热潮。特别是,大量的研究集中在地理标记数据的分析上,因为这使得虚拟世界和物理世界之间建立了强大的联系。Colombo等人[1]研究了Foursquare活动以分析人类的移动模式。作者发现,无论是家庭还是工作场所的访问都非常规律,因此很容易预测。Song等人[19]探索了人类移动的可预测性的界限,DeDomenico等人[2]则展示了如何整合用户朋友的移动信息可以更容易地预测用户自己的移动。另一方面,DeMontjoye等人[3]和Rossi等人[15-17]研究了这些地理标记活动数据集在多大程度上可以用于侵犯用户的隐私。像Instagram和Flickr这样的基于图像的社交媒体允许用户对照片进行地理标记并与朋友分享。与纯粹基于位置的社交网络不同,重点不在于位置,而在于分享的图像。这反过来为我们理解与我们周围世界相关的人类行为提供了一个非常丰富的信息来源。Hochman和Schwartz[5]收集了纽约市和东京的Instagram照片,并研究了两个城市收集的图像之间的色调和亮度差异。他们确定了提供关于本地和全球文化实践的不同视觉节奏。Hu等人[6]对Instagram社交网络进行了首次定量分析。与我们的工作类似,他们使用尺度不变特征变换(SIFT)[10]特征和词袋(BOW)[18]来描述图像,并使用k-means将其聚类成8个类别。有了这些类别,他们确定了不同类型的Instagram用户,并研究了用户的关注者数量与他们在Instagram上分享的照片之间的关系。Souza等人[20]收集了一个Instagram数据集。0他们确认了自拍的日益流行,并显示了一个国家中自拍数量与该国个性化和联系文化之间的关系。Instagram的照片还被用于了解世界各地的饮食习惯[11],以及自动捕捉城市环境中的气味和颜色[12,14]。在这项工作中,我们提出使用Instagram照片来描述旅游消费。Latorre-Martínez等人[8]和Iniguez等人[7]也使用从Flickr和Instagram收集的照片研究旅游消费(在西班牙萨拉戈萨)。然而,他们的分析只关注地理位置指标和标签,没有利用图像本身提供的视觉信息。我们采取了一种补充的方法,决定研究图像的内容,这反过来使我们能够利用比仅仅使用标签更丰富的信息源。我们的工作与Hu等人[6]的工作有一些相似之处,他们也使用计算机视觉技术将图像自动分组为类别。与他们不同的是,我们采用了一种监督方法,并使用更复杂的框架对图像进行分类。这反过来使我们能够定义更有意义的类别,并衡量所得分类的质量。03 数据集描述0我们使用Instagram API5在2014年1月至2015年12月之间检索了约90k张在威尼斯拍摄的地理标记照片。我们使用了MediaSearch端点,该端点允许我们在特定日期上搜索一个圆形区域,通过指定一对纬度/经度坐标、半径和日期。具体而言,我们在坐标网格上调用此方法,以最大限度地覆盖对应于威尼斯地理区域的矩形区域,同时最小化重叠。另一种解决方案是选择一个半径足够大以包含整个威尼斯城的单个圆形区域,但由于API对每个请求的最大结果数的限制,我们拒绝了这种解决方案。每次对MediaSearch端点的查询都返回一个JSON文件,其中包含以下属性之一:1)图像的唯一ID,2)图像的URL,0Track: 第八届位置与网络国际研讨会WWW 2018,2018年4月23日至27日,法国里昂7ownVFapeVarLeV7ownVFapeVarLeV73 11260811 722807112 714111010 11 64780252865315 12 16 12 42(a) M = 17ownVFape9arLeV7ownVFape9arLeV68514220968170150765002808855524004077 190942679(b) M = 211920泻湖0艺术0民间传说0食物0泻湖0艺术0民间传说0食物0泻湖0艺术0民间传说0食物0泻湖0艺术0民间传说0食物0图2:不同M参数值的混淆矩阵,该参数控制将图像分配给“其他”类别的概率。0我们使用这些数据来检索实际图像,3)图片的纬度和经度,以及4)标签、评论和其他信息。请注意,InstagramAPI自2016年6月1日起发生了变化。更新引入了对MediaSearch端点的一些重要限制和限制。通过InstagramAPI检索到的照片可能非常不同,主题、比例、方向和亮度都有所变化。为了进行本研究,我们决定将图像分为6个类别:1)泻湖,2)城市景观,3)艺术,4)民间传说,5)食物和6)其他。图1展示了每个类别的一些样本图像。泻湖类别由在泻湖附近或内部拍摄的照片组成,其特点是图像底部通常有水,以及其他物体,如船只。城市景观类别包括在威尼斯市拍摄的照片,其特点是有桥梁、教堂、广场等建筑元素。艺术类别由在博物馆和艺术画廊内拍摄的照片组成,而属于民间传说类别的照片与狂欢节活动或威尼斯民间传说元素相关,例如威尼斯面具。食物类别包括菜肴和饮料的照片。最后,其他类别包括所有不属于前述任何类别的图像。手动注释9万张图像将是一项非常耗时的任务。因此,在本研究中,我们提出使用一个简单但有效的框架来自动注释我们的数据集,给定一组手动注释的训练集。值得注意的是,选择这6个类别是因为它们捕捉到了威尼斯的著名地标(例如泻湖)。同样,我们选择民间传说类别是因为我们预计在狂欢节期间这将变得特别重要。要在不同的城市进行类似的研究,可能需要选择与地理区域和研究期间相适应的不同类别。选择这些类别的一种可能方法是使用与图像相关的标签或其他文本描述符。然而,支撑本研究的方法基本上是相同的。最后,一种替代的无监督方法是通过对图像进行聚类来提取一些类别,06 http://developers.instagram.com/post/133424514006/instagram-platform-update0(a)城市景观(民俗)0(b)其他(城市景观)0图3:两个被错误分类的照片示例。(a)是一个被错误分类为“城市景观”照片的“民俗”照片(0.37的概率对比0.33的“民俗”),而(b)是一个被错误分类为“其他”照片的“城市景观”照片(0.46的概率对比0.35的“城市景观”)。0然而,得到的类别仍然需要验证以选择最相关的类别。04 图像分类框架0图像分类框架如下。我们使用VLFeat库[22]中实现的密集SIFT算法的一个版本[10]来提取数据集中每个图像的一组关键点。SIFT关键点是图像的一个圆形区域,具有描述局部图像外观的特征向量。尽管计算速度快,但SIFT特征被设计为具有对图像平移、缩放和旋转的不变性,以及对光照变化的部分不变性和对局部几何失真的鲁棒性。有了这些特征向量,我们使用k-means对它们进行聚类,并提取一组形成我们BOW表示字典的码字。给定一个带有一组SIFT特征和码字字典的图像,我们将每个特征分配给最近的码字,从而将原始图像表示为码字的直方图。对于一组带标签的图像,相应的直方图用于使用径向基函数(RBF)核[23]训练一组一对一支持向量机(SVM)分类器。回想一下,在一对一方法中,我们需要训练一组二进制分类器,每个类别对应一个。然后,每个分类器为两个类别中的一个投票,最终的类别标签由(加权)多数投票决定。另一种方法是使用一对多方法,其中对于每个类别,我们定义一个单一的分类器,该分类器的正样本是该类别的样本,负样本是所有其他类别的样本。在本文中,我们选择一对一方法,因为这样可以在类别之间提供更大的决策边界灵活性。有了这个框架,给定一个无标签的图像,它的BOW表示被传递给SVM分类器。输出是一个类别的概率分布[23],最大概率的类别最终用于标记原始图像。0Track: 第八届位置和网络国际研讨会WWW 2018,2018年4月23日至27日,法国里昂050001000015000200002500030000201420151015002000250030003500201420151214161820Using the proposed classier, we assign a class label to each ofthe 90k images in our dataset. Fig. 4(a) shows the distribution ofcategories in 2014 and 2015. Note that in both years about 50% ofthe images are assigned to Other, for a total of about 44k images.Note that in the remainder of the paper we will not consider theimages belonging to this category. In general, we observe that thenumber of images taken during 2015 is signicantly higher than in2014.Fig. 4(b) also shows a clear rise in Instagram activity over Venice.This is in line with the worldwide growth in Instagram active users,which have more than doubled from the beginning of 2014 to theend of 20157. We also observe the presence of a peak in Instagramactivity in the periods of Carnival in 2014 and 2015, reecting theincreased number of tourists during Venice Carnival.Finally, Fig. 4(c) shows the variation over the year 2015 of the per-centage of photos belonging to the Art category. The circular shadedarea shows the Carnival period, while the rectangular shaded areahighlights the months during which the 56th “Art Biennale" exhi-bitions took place (from the 9th May to the 22nd November 2015).We observe a clear increase in the percentage of images belongingto the Art category. Note that this is not inuenced by the increaseof Instagram users observed during the same period, as here wemeasured the fraction rather than the absolute number of Art im-ages. While the increase of Art pictures during the “Art Biennale"does not come as a surprise, we argue that the relative increase of7https://www.statista.com/statistics/253577/number-of-monthly-active-instagram-users/11930泻湖0城市景观0艺术0民俗0食物0VarLeV0图片数量0(a)类别的直方图0JDn02月00Dr0ASr00Dy06月0JuO0AuJ0SeS02Ft01ov0DeF0图片数量0(b)随时间拍摄的照片数量0JDn02月00Dr0ASr00Dy06月0JuO0AuJ06eS02Ft01ov0DeF0艺术图片的百分比0(c)2015年“艺术”照片的频率0图4:2014年和2015年每个类别拍摄的照片数量的直方图(a),显示2014年和2015年拍摄的照片总数增长的折线图(b),以及显示2015年“艺术”类别照片比例的折线图(c)。在(c)中,阴影的圆形和矩形区域分别突出了嘉年华和双年展的时间段。04.1 图像分类器评估0为了训练分类器,我们手动标记了每个6个类别的100张图片,总共600张图片。有了这个数据集,使用5折交叉验证评估了分类器的性能。图2(a)显示了得到的混淆矩阵。平均分类准确率为68%,f-measure为68%。然而,对于前5个类别,错误分类的图片数量较少,而对于“其他”类别,错误分类的图片数量急剧增加,超过50%的属于“其他”类别的照片被错误分类为属于其他类别。这是一个重要的问题,因为我们预计我们的数据集中有大量的图片属于这个类别。实际上,在我们的数据集中,“其他”基本上是一个占位符,表示不属于我们感兴趣的5个类别的任何内容。为了解决这个问题,我们决定将图片被分配到“其他”类别的概率乘以一个参数M,通过对训练集进行5折交叉验证来优化该参数。图2(b)显示了最优值M=2的混淆矩阵。相应的平均准确率为69%,f-measure为70%。请注意,前5个类别的误报数量大大减少,而“其他”类别的误报数量显著增加。由于我们主要关注的是前5个类别,我们希望尽可能减少这些类别的误报数量。因此,我们使用M=2的分类器为数据集中的其余图片分配标签。图3显示了两个错误分类的示例图片。图3(a)显示了一张属于“民俗”类别的龙船图片,但被错误分类为“城市景观”。这是一张具有挑战性的图片,人类很容易将其分类为任一类别,也可以分类为“泻湖”。分类器将最高概率(0.37)分配给“城市景观”类别,而将第二高概率分配给“民俗”类别(0.33)。另一方面,图3(b)显示了一张属于“城市景观”类别的图片,但被错误分类为“其他”。在这种情况下,错误是由于M校正造成的,该校正人为地增加了将图片分配给“其他”类别的概率。0从0.23增加到0.46。第二个最有可能的类别确实是“城市景观”(0.35)。请注意,如果没有这个校正,图片将被正确分类。05 数据分析0在本节中,我们展示了实验分析的结果。在一些初步分析之后,我们研究了图片在时间和空间上的分布,并最后集中讨论了狂欢节期间(2015年2月)的情况。05.1 时间分析0研讨会: 第八届位置与网络国际研讨会WWW 2018,2018年4月23日至27日,法国里昂8http://www.labiennale.org/en/biennale/organization/9https://en.wikipedia.org/wiki/Palazzo_Grassi10https://en.wikipedia.org/wiki/Church_of_San_Giorgio_Maggiore11940图5:照片在“泻湖”(a,b)和“城市景观”(c,d)类别中的地理分布。在“泻湖”类别中,最高密度的区域位于水道附近,而“城市景观”照片主要分布在威尼斯中心区域。0狂欢节期间艺术图片的比例是由于在这段时间内组织在博物馆和艺术画廊的大量文化活动。05.2 地理空间分析0我们现在关注数据的空间分布。对于5个主要类别(排除“其他”),我们绘制了数据地理分布的热图。05.2.1泻湖和城市景观热图。图5(a)和图5(b)分别显示了2014年和2015年的“泻湖”类别照片的分布。正如预期的那样,属于这一类别的大多数图片都在水道附近,包括运河(例如“大运河”和“朱迪卡运河”)和泻湖(例如“圣马可”和“朱迪卡”)。同样,我们预计“城市景观”类别的照片分布在整个城市区域,最密集的点位于最具旅游吸引力的地点附近,例如“Rialto”和“SanMarco”。图5(c)和图5(d)显示了威尼斯中心区域照片密度最高的地方,这支持了这种直观的判断。这些发现对图像分类器的正确性提供了强有力的定性验证,进一步支持了前几节的定量评估。05.2.2艺术、民俗和美食热图。位于威尼斯的Biennale基金会是世界上最重要的文化组织之一。它负责组织,0活动,包括“艺术双年展”(奇数年举办),“威尼斯建筑双年展”(偶数年举办)和“威尼斯电影节”(每年举办)8。因此,不足为奇的是,这些活动举办地的建筑物是艺术热点之一(参见图6(a)和6(b))。其他密度较高的显著区域包括“威尼斯兵工厂”和“古根海姆博物馆”。除了这些地点,2015年记录的更多数据使我们能够找到更多艺术类别中活动频繁的区域,包括“PalazzoGrassi”(一座俯瞰大运河的著名艺术画廊9)和“San GiorgioMaggiore”(意大利建筑师安德烈亚∙帕拉第奥设计的16世纪教堂,内有雅各布∙廷托雷托的多幅画作10)。对于“民俗”类别,图6(c)和图6(d)显示了威尼斯最中心和最具旅游吸引力的区域拍摄的照片密度较高。更有趣的是,这些热点似乎沿着连接威尼斯“SantaLucia”火车站和“SanMarco”广场的最短路径排列,途经“Campo SanPolo”,“Campo SanSilvestro”和“Rialto”。这表明在民俗相关活动(如狂欢节)期间,游客参观威尼斯时存在一条首选路线。我们称之为“民俗线”。确实,在狂欢节期间,大部分面具都在“Rialto”和“SanMarco”地区,而从公交车到这些地方的最短路径0研讨会: 第八届位置与网络国际研讨会WWW 2018,2018年4月23日至27日,法国里昂11950(a) 2014年艺术0(b) 2015年艺术0(c) 2014年民俗0(d) 2015年民俗0(e) 2014年食物0(f) 2015年食物0图6:艺术(a,b),民俗(c,d)和食物(e,f)类别照片的地理分布。请注意,艺术类别的最高密度区域位于知名的艺术场所附近,而民俗类别的大部分图片位于连接威尼斯火车站(岛上的主要入口)和“圣马可”广场(面具密度最高的区域之一)的直线路径上。0火车站(威尼斯的主要入口)与民俗线路重合。我们的分析还显示,“圣马可”区域在大部分时间内拥有最高比例的民俗图片,2014年狂欢节期间,该区域拍摄的图片占比超过19%,第二受欢迎的区域是“圣保罗”(通过“里亚托”桥与“圣马可”相连),该区域拍摄的民俗图片约占14%。我们考虑的最后一个类别是食物。2014年和2015年的热力图分别显示在图6(e)和图6(f)中。初看这些图可能不太清晰,但仔细观察可以发现,图片密度最高的地点对应着知名的美食场所,例如“Al Timon”,“Tonolo”和“Al ParadisoPerduto”。0有趣的是,一些拥有知名餐厅的地区在我们的分析中没有被发现。我们认为这是由于它们的位置位于主要旅游路线之外。05.3 案例研究:2015年威尼斯狂欢节0我们以对2015年2月1日至2月14日期间的威尼斯狂欢节进行更详细的分析来结束我们的研究,与之后一个月的同一天(2015年3月1日至3月14日)进行对比。如预期,狂欢节期间民俗图片的频率为17%。0研究方向:第八届国际位置与网络研讨会WWW 2018,2018年4月23日至27日,法国里昂51015202511960(a) 狂欢节期间(2015年2月)0(b) 狂欢节之后(2015年3月)0图7:狂欢节期间(a)和之后(b)民俗类照片的地理分布。请注意在(a)中民俗线的出现。0圣克罗切0圣克罗切0卡斯特0多尔苏德0圣保罗0圣保罗区0%民俗类图片0狂欢节期间狂欢节之后0图8:2015年狂欢节期间和之后每个社区中民俗类照片的百分比。0与三月相比,狂欢节期间民俗类图片的比例显著高于14%。同样,民俗类别在狂欢节期间是第二常见的拍摄类别,但在狂欢节之后降至第四位。图7(a)和图7(b)显示了民俗类图片的地理分布。请注意狂欢节期间民俗线的出现,而在我们考虑的三月两周内该线路消失。最后,图8显示了威尼斯六个主要区域在狂欢节期间和之后属于民俗类别的照片百分比的柱状图。与图7一样,我们观察到狂欢节之后民俗类图片数量的下降,与狂欢节期间相比。最大的下降发生在“圣克罗切”(从19%下降到11%)和“圣马可”(从15%下降到23%),它们分别是民俗线的起点和终点。06 讨论和局限性0照片分享社交媒体为研究人类行为提供了丰富的信息来源。能够对此类数据进行地理标记进一步扩展了分析的可能性。然而,与文本字符串或关键词列表相比,解释图像内容的难度增加了。在这里,我们提出了一种简单但有效的计算机0视觉流水线用于分析在Instagram上分享的图像,并将其分配到一组预定义的类别中。虽然存在更准确的图像分类技术(例如,[24]),但我们认为所提出的框架在准确性和计算复杂性之间提供了良好的平衡。然而,我们还应强调,尽管实验结果突出了分类器的质量和整体框架揭示文化和美食热点的能力,但我们的研究存在一些重要的局限性。例如,我们发现在某些情况下,分类器无法就某些图片的类别成员资格达成明确的共识(见图3(b))。在这些情况下,我们的方法是将图像分配给“其他”类别。虽然这确保了分配给其他类别的图像不太可能被错误分类,但这也意味着一些图像被错误地分配到“其他”类别,从而减少了我们可以分析的数据量。解决这个问题的一种方法可能是在类别成员资格不明确时,在分类过程中整合标签和其他文本属性。然而,在某些情况下,一张图片实际上可能属于多个类别(见图3(a))。这可以通过扩展所提出的分类器以处理多标签分类[21]来解决。一个相对简单的解决方案是使用像本文中使用的软件库一样的现成软件库[11]。然而,请注意,这将需要重新标记整个训练集,为每个图像分配多个标签。我们的工作结果可能在许多领域应用,从城市规划到市场营销和广告活动。一个可能的应用是使用该框架指导城市地区的发展,特别是投资的分配,以促进和支持旅游业。可以通过查看游客在Instagram或Flickr等平台上留下的数字痕迹来识别需要发展的社区。如果与标签或其他捕捉到一个地方吸引力的感知信息相结合,这将特别有趣。我们还可以设想一个系统,通过将我们的框架给出的城市表示与用户的偏好相链接,创建个性化的旅游指南,类似于Quercia等人提出的方法[12-14]。用户的偏好011 http://scikit-learn.org/stable/modules/multiclass.html0Track: 第八届国际位置与网络研讨会WWW 2018,2018年4月23日至27日,法国里昂11970可以通过他/她分享的照片确定他/她的旅游偏好,并且可以通过查看从其他用户收集的同一区域的聚合数据来建议与他/她的偏好相匹配的区域的行程。07 结论和未来工作0在本文中,我们通过社交媒体的视角探索了旅游消费。我们收集了2014年1月至2015年12月在威尼斯市拍摄的9万张Instagram照片的数据集。我们设计了一个简单但有效的监督分类框架,将每个图像自动分配到六个预定义的类别之一。我们的分析突出了一些旅游热点的存在,与受欢迎的文化和美食场所相关。我们观察到,这种信号受到一些外部事件的影响,例如民俗和艺术节。有趣的是,我们发现照片的空间分布可以揭示某些事件期间的首选旅游路线,例如狂欢节期间的“民俗线”。这项工作的一个明显扩展是改进分类器,例如用卷积神经网络提取的特征替换SIFT特征。考虑与图片相关的文本信息,例如描述、评论和标签,也将非常有趣。这反过来将使我们能够设计一个更强大的分类器。更有趣的是,可以使用自然语言处理技术来理解与某张图片相关的情绪,从而增加了一层附加的分析。0参考文献0[1] Gualtiero B Colombo,Matthew J Chorley,Matthew J Williams,Stuart MAllen和Roger M Whitaker. 2012.你在哪里吃饭:Foursquare签到作为人类移动和行为指标。在2012年IEEE国际会议上的普适计算和通信研讨会(PERCOM Workshops)中。IEEE,217-222。[2] Manlio DeDomenico,Antonio Lima和Mirco Musolesi. 2013.人类移动性和社交互动的相互依赖性和可预测性。Pervasive and MobileComputing,2013年9月6日,9,6(2013年),798-807。[3] Yves-Alexandre DeMontjoye,César A Hidalgo,Michel Verleysen和Vincent D Blondel. 2013.人类移动性的隐私界限。科学报告,2013年3月。[4] David L Groves和Dallen J Timothy.2001. 旅行设计中的摄影技术和影响力和重要性属性的测量:一个案例研究。Loisir etSociété/Society and Leisure,2001年1月,24,1(2001年),311-317。[5] NadavHochman和Raz Schwartz. 2012.可视化Instagram:追踪文化视觉节奏。在第六届国际AAAI博客和社交媒体会议(ICWSM-12)上的社交媒体可视化研讨会论文集中。6-9。[6] Yuheng Hu,LydiaManikonda,Subbarao Kambhampati等。2014.我们在Instagram上发布了什么:对Instagram照片内容和用户类型的初步分析。在ICWSM中。[7] T Íñiguez-Berrozpe,M Plumed-Lasarte和MP Latorre-Martínez. 2016.Flickr:旅游消费市场分析的工具。管理环境:旅游的可持续性和经济发展(2016年),20。[8] María Pilar Latorre-Martínez,Tatiana Iñíguez-Berrozpe和MartaPlumed-Lasarte. 2014.以图像为中心的社交媒体用于旅游消费市场分析。国际技术管理杂志,2014年1月,64,1(2014年),17-30。[9] Iris Sheungting Lo,Bob McKercher,Ada Lo,CatherineCheung和Rob Law. 2011.旅游和在线摄影。旅游管理,2011年4月,32,4(2011年),725-731。[10] David GLowe. 2004.尺度不变关键点的独特图像特征。国际计算机视觉杂志,2004年2月,60,2(2004年),91-110。[11] Yelena Mejova,So�ane Abbar和Hamed Haddadi. 2016.数字时代的食物迷恋:全球范围内的#foodporn。arXiv预印本arXiv:1603.00229(2016)。[12] Daniele Quercia,Luca Maria Aiello和Rossano Schifanella. 2016.城市气味的情感和色彩层面。在第十届国际会议上。02016年5月17日至20日,德国科隆举行的网络和社交媒体会议。309-318。[13] DanieleQuercia, Rossano Schifanella和Luca Maria Aiello. 2014.通往幸福的最短路径:在城市中推荐美丽、安静和快乐的路线。在第25届ACM超文本和社交媒体会议论文集中。ACM,116-125。[14] Daniele Quercia, Rossano Schifanella,Luca Maria Aiello和Kate McLean. 2015.臭味地图:城市气味景观的数字生活。在第九届国际网络和社交媒体会议ICWSM2015中。牛津大学,英国牛津,2015年5月26日至29日。327-336。[15] LucaRossi和Mirco Musolesi. 2014.这是你签到的方式:识别基于位置的社交网络中的用户。在第二届ACM在线社交网络会议论文集中。ACM,215-226。[16] Luca Rossi,James Walker和Mirco Musolesi. 2015.利用GPS移动性数据进行用户识别的时空技术。EPJ数据科学,2015年4月1日,4,1(2015年),1。[17] Luca Rossi,Matthew J Williams,Christoph Stich和Mirco Musolesi.2015.隐私与城市:基于位置的社交网络中的用户识别和位置语义。arXiv预印本arXiv:1503.06499(2015)。[18] Josef Sivic和Andrew Zisserman. 2009.视频文本检索的高效视觉搜索。IEEE模式分析与机器智能交易,2009年4月,31,4(2009年),591-606。[19] Chaoming Song,Zehui Qu,Nicholas Blumm和Albert-LászlóBarabási. 2010.人类移动性的可预测性限制。科学,2010年5968,327,1018-1021。[20] FlávioSouza,Diego de Las Casas,Vinícius Flores,SunBum Youn,MeeyoungCha,Daniele Quercia和Virgílio Almeida. 2015.自拍时代的黎明:Instagram上的自拍者是谁,他们在哪里,以及如何。在2015年ACM在线社交网络会议论文集(COSN'15)中。ACM,221-231。[21] GrigoriosTsoumakas和Ioannis Katakis. 2006.多标签分类:概述。塞萨洛尼基亚里斯多德大学信息学系,希腊(2006)。[22] AndreaVedaldi和Brian Fulkerson. 2010.VLFeat:一种开放和便携的计算机视觉算
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 十种常见电感线圈电感量计算公式详解
- 军用车辆:CAN总线的集成与优势
- CAN总线在汽车智能换档系统中的作用与实现
- CAN总线数据超载问题及解决策略
- 汽车车身系统CAN总线设计与应用
- SAP企业需求深度剖析:财务会计与供应链的关键流程与改进策略
- CAN总线在发动机电控系统中的通信设计实践
- Spring与iBATIS整合:快速开发与比较分析
- CAN总线驱动的整车管理系统硬件设计详解
- CAN总线通讯智能节点设计与实现
- DSP实现电动汽车CAN总线通讯技术
- CAN协议网关设计:自动位速率检测与互连
- Xcode免证书调试iPad程序开发指南
- 分布式数据库查询优化算法探讨
- Win7安装VC++6.0完全指南:解决兼容性与Office冲突
- MFC实现学生信息管理系统:登录与数据库操作
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功