没有合适的资源?快使用搜索试试~ 我知道了~
17210利用智慧城市特征映射法令和推文以辅助意见挖掘0Manish Puri 计算机科学系蒙特克莱尔州立大学美国新泽西州蒙特克莱尔purim1@montclair.edu0Xu Du 环境管理博士项目蒙特克莱尔州立大学美国新泽西州蒙特克莱尔dux3@montclair.edu0Aparna S. Varde计算机科学系/环境管理博士项目蒙特克莱尔州立大学美国新泽西州蒙特克莱尔vardea@montclair.edu0Gerard de Melo 计算机科学系罗格斯大学美国新泽西州皮斯卡塔韦gdm@demelo.org0摘要0本研究侧重于挖掘法令(地方法律)和公众对其在社交媒体上的反应。我们特别强调与智慧城市特征(SCCs)相关的法令和推文,因为我们的工作的一个重要目标是评估一个给定地区朝着智慧城市的发展程度。我们依靠SCCs作为看似无限数量的法令和推文之间的纽带,以便能够将它们映射起来,并且为了基于公众反应向城市机构提供反馈而便于基于SCC的意见挖掘。我们的方法利用常识知识来反映人类判断的映射。本文介绍了我们在法令和推文映射与SCCs方面的研究,包括提出的映射方法,我们的初步实验,相关讨论和未来工作。据我们所知,我们的工作是首次对智慧城市的法令和推文进行挖掘之一。这项工作具有更广泛的影响,旨在促进智慧城市的发展。0CCS概念0• 信息系统 → 数据挖掘;内容分析和特征选择;聚类和分类;0关键词0社交媒体,企业智能,知识库,地方法律,自然语言处理,情感分析,文本挖掘0ACM参考格式:Manish Puri,Xu Du,Aparna S. Varde和Gerard deMelo。2018年。利用智慧城市特征映射法令和推文以辅助意见挖掘。在WWW '18Companion:2018年网络会议伴侣,2018年4月23日至27日,法国里昂。ACM,纽约,美国,8页。https://doi.org/10.1145/3184558.31916320本文发表在知识共享署名4.0国际(CC BY4.0)许可下。作者保留在其个人和公司网站上传播作品的权利,并附上适当的归属。WWW '18 Companion,2018年4月23日至27日,法国里昂,©2018IW3C2(国际万维网会议委员会),根据知识共享CC BY 4.0许可发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.319163201 引言0本研究致力于挖掘城市政策。我们的愿景是分析网站上的法令或地方法律,以了解社交媒体上对它们的公众反应。这使得我们能够进行相关调查,评估居民的意见,反映他们对城市政策的满意度和观点。我们工作的一个重要焦点是确定这些法令在多大程度上有助于将相关城市地区建设为智慧城市。因此,我们的目标是根据其相关的智慧城市特征(SCCs)对这些法令进行分类,其中在图1中显示了一小部分亮点(图像来源[19])。公众舆论是从Twitter上收集的,鉴于其作为拥有超过3.3亿活跃用户的微博网站的作用。本研究的具体目标是将法令与表达公众对其反应的Twitter上的推文联系起来。0图1:智慧城市特征-亮点0我们的目标是通过利用语义相关性将法令与相关推文联系起来。这是非常复杂的,因为法令和推文都涉及高度复杂和相当异质的自然语言,所以简单的关键词匹配是不够的。传统的机器学习技术[36]和相关进展不适合学习这种映射,因为它们0跟踪:社交感知和企业智能 朝着智能企业转型 WWW 2018年4月23日至27日,法国里昂17220由于我们的研究是在法规挖掘方面的开创性工作,我们没有这样的先前训练数据。为了克服这些挑战,我们提出了一种利用法规与推文之间的SCC关系的传递性质进行映射的两步方法。具体而言,我们调用的传递性质是:如果法规与给定的SCC相关联,任何推文与相同的SCC相关联,则法规与推文存在联系。之所以提出这种方法,是因为经典的SCC数据源(例如[16,19])是有限的,并且仅限于一组有限的可靠特征用于映射(见图1)。因此,这种传递性方法比直接将看似无限数量的推文与来自各个网站的法规相关联更可行。作为第一步,我们使用基于常识知识(CSK)的基于经典SCC数据源发现SCC与法规之间的联系。在第二步中,我们考虑将推文映射到SCC,同样利用这种CSK。这种方法使我们能够直接将法规和推文与智慧城市的相关方面联系起来,并为使用适当的方法评估公众意见的情感极性分类[10,23]和情感方面分析[34]的推文奠定基础。这项工作旨在通过为智慧城市的发展做出贡献来产生更广泛的影响。如果我们确定了城市机构通过地方法律或法规所涉及的SCC,我们就能够提供关于他们的城市政策在各个类别上是否朝着智慧城市发展的方向前进的反馈。此外,这项工作与社交感知的主题相关。通过使用SCC将法规与推文连接后,通过意见挖掘推断出的公众反应还可以使涉及的城市委员会和管理机构评估公众满意度。这可以用于从公众意见的角度评估智慧城市法规的吸引力,从而为可能使他们改进智慧城市发展政策的机构提供有用的反馈。为了实现这种分析,我们借鉴了文本挖掘、自然语言处理和常识知识的人工智能方面。本文的其余部分安排如下。第2节描述了相关工作。第3节解释了我们提出的将法规与社交媒体帖子连接起来的映射方法。第4节通过实验和讨论对其进行了总结评估。第5节给出了结论,包括我们的发现和正在进行的研究的描述。02 相关工作0虽然在挖掘社交媒体方面已经有大量的工作,但大部分以前的工作与我们在这里考虑的任务有很大的不同。社交网络中的链接预测研究有着悠久的历史[2,35]。然而,这些方法是针对同质节点之间创建链接的,比如预测社交网络用户之间的友谊连接。对于实体解析[7]和资源对齐[8]等更长期存在的问题的大部分研究也是如此。只有少数方法针对任意实体和概念之间的开放领域链接[1, 4, 9, 25,26]。然而,这些方法需要大量的训练数据。由于我们的工作是在法规挖掘方面的开创性工作,我们没有这样的先前训练数据。为了克服这些挑战,我们提出了一种利用法规与推文之间的SCC关系的传递性质进行映射的两步方法。具体而言,我们调用的传递性质是:如果法规与给定的SCC相关联,任何推文与相同的SCC相关联,则法规与推文存在联系。之所以提出这种方法,是因为经典的SCC数据源(例如[16,19])是有限的,并且仅限于一组有限的可靠特征用于映射(见图1)。因此,这种传递性方法比直接将看似无限数量的推文与来自各个网站的法规相关联更可行。作为第一步,我们使用基于常识知识(CSK)的基于经典SCC数据源发现SCC与法规之间的联系。在第二步中,我们考虑将推文映射到SCC,同样利用这种CSK。这种方法使我们能够直接将法规和推文与智慧城市的相关方面联系起来,并为使用适当的方法评估公众意见的情感极性分类[10,23]和情感方面分析[34]的推文奠定基础。这项工作旨在通过为智慧城市的发展做出贡献来产生更广泛的影响。如果我们确定了城市机构通过地方法律或法规所涉及的SCC,我们就能够提供关于他们的城市政策在各个类别上是否朝着智慧城市发展的方向前进的反馈。此外,这项工作与社交感知的主题相关。通过使用SCC将法规与推文连接后,通过意见挖掘推断出的公众反应还可以使涉及的城市委员会和管理机构评估公众满意度。这可以用于从公众意见的角度评估智慧城市法规的吸引力,从而为可能使他们改进智慧城市发展政策的机构提供有用的反馈。为了实现这种分析,我们借鉴了文本挖掘、自然语言处理和常识知识的人工智能方面。本文的其余部分安排如下。第2节描述了相关工作。第3节解释了我们提出的将法规与社交媒体帖子连接起来的映射方法。第4节通过实验和讨论对其进行了总结评估。第5节给出了结论,包括我们的发现和正在进行的研究的描述。0这些方法通常假设结构化数据作为输入,即具有一系列属性的实体。在我们的情况下,我们试图连接两种形式的非结构化自然语言文本。一方面,我们有使用高度正式语言表达的公共法规,充满了法律术语。另一方面,我们有社交媒体帖子,其中的文本通常非常非正式,包括嵌入的标签、URL等。对于社交媒体文本,一个重要的研究方向是无监督的主题建模和趋势检测[15]。在[38]中,使用模糊方法对Twitter中的标签进行预处理和分析,研究模糊聚类以调查标签流行度的时间趋势。然而,这些方法在我们研究中无法轻易应用于将推文映射到预先存在的法规集合的任务。文档的神经向量表示[5]在我们的情况下也无法成功。最近一些关于链接社交媒体文本的方法依赖于监督分类。虽然标准方法可以应用于预测异构项之间的链接[36],但一个重要的挑战是需要大量的训练集来准确处理推文的长度短(导致数据稀疏性)和变异性。为了克服这个问题,TweetSift系统[18]通过利用外部实体知识和增强主题的词嵌入来对推文进行主题分类。后者导致了特定主题的词嵌入,使得模棱两可的词的不同意义获得不同的表示。然而,这假设知识库可以提供与特定Twitter用户等实体相关的高度相关的信号。相比之下,我们的模型利用了通用的常识知识,并且不需要详细的标记训练集。此外,以前的工作没有考虑到法规(与推文)和智慧城市特征的设置,以及它们在语言上的挑战性。据我们所知,我们的工作是该领域的开创性研究之一。近年来,智慧城市受到了广泛关注。巴塞罗那的公交车设计为在功耗最佳的路线上运行[19]。阿姆斯特丹的运河灯根据行人使用情况自动调亮和调暗[19]。[22]中的工作通过嵌入常识知识来增强自动驾驶车辆的潜力。这些倡议主要贡献于“智能移动”特征。在利用技术打击犯罪方面也有重要的研究,例如在欧盟ePOOLICE项目中开发的用于识别和分类文本文档中与犯罪相关的事件的监控系统[24]。这样的研究对“智能生活”特征有所贡献。[21]中的工作通过云计算解决方案为数据中心提供了“智能环境”特征。他们分析了云模型在提供更高能效的同时满足生产力目标的场景。[20]中讨论了数据中心的温度、湿度和其他参数,通过考虑温度、湿度和其他参数来实现数据中心的自由冷却,也有助于“智能环境”。[37]中的工作对“智能经济”有着间接的影响。作者提出了一种通过合作来最小化预定取货和交付之间的行程的数学模型。这是一种在城市交付系统中降低运营费用的成本效益方法。0论文主题:社会感知与企业智能 迈向智能企业转型 WWW 2018,2018年4月23日-27日,法国里昂17230合作模式。同样,[33]中的研究通过为英语作为第二语言的学习者提供基于搭配的写作辅助工具来间接影响“智慧人民”特征,因为他们构成了全球城市人口的很大一部分。[12]的工作主要通过分析污染物数据来估计空气质量,从而对“智慧环境”产生影响,但也对“智慧生活”产生了次要影响,因为它从健康的角度解决了问题。因此,有几位研究人员正在进行研究,以增强智慧城市的特征。我们在本文中的工作旨在通过在智慧城市领域部署常识知识来产生显著影响。虽然像[11,17]这样的作品在“智慧移动”和“经济”领域提出了对常识的需求,但在这些范式中实际使用这种知识仍处于起步阶段,例如[22]。正如[31]中对机器智能中常识(获取、表示和应用)的几项研究所述,许多领域中对CSK的增加使用将促进更智能的机器。我们在本文中的研究旨在在这条道路上迈出重要的一步,总体目标是增强智慧城市。03 提议的映射方法0我们通过智慧城市特征(SCCs)提出的法令到推文映射的方法如图2所示。详细描述如下。0图2:SCC映射的提议方法03.1 基于CSK-SCC的知识库开发0我们方法中使用的SCC来源源自TUWien的广泛接受的技术报告[19],该报告列举了六个SCC。它们分别是“智慧治理”(或“政府”)、“智慧经济”、“智慧移动”、“智慧环境”、“智慧人民”和“智慧生活”。例如,考虑到SCC“智慧治理”。它包括下列特征,其中一些特征也包含在图1中列出的亮点中。• 政府透明度• 优化公共服务和行政• 直接参与公共政策•公民参与• 与公民之间积极开放的沟通渠道•通过反馈和参与做出更明智的决策0图3:WebChild的相关部分截图0因此,如果法令引用了上述任何特征,我们推断它们很可能与智慧治理有关。然而,这些表达通常不会在法令中直接观察到。如果人类用户检查这些法令,他们可以依靠语言知识和常识来找到相关联系,这些联系通常非常微妙。为了自动化这个过程,我们利用常识知识(CSK)网络资源,具体来说是大型WebChild存储库[28,30],其中包含从大量网络数据中挖掘出的常识概念及其属性和关系。图3显示了WebChild浏览器的部分截图。它描述了一个相关的概念“经济”,它与特定的SCC相关。我们使用WebChild作为主要的CSK来源,以及用于知识库开发的必要信息[32]和其他与常识相关的来源,如词汇数据库WordNet[14],我们基于智慧城市特征(DomainKBs withSCC)构建了基于领域的知识库。这些知识库是基于文本的,包含从CSK存储库和SCC来源中提取的与特定智慧城市特征相关的术语,使用自然语言处理和语义匹配。请注意,也可以应用从文本中提取知识库的技术[27,29]和规则挖掘[6]来增加这些领域知识库的规模。图4显示了我们的一部分领域知识库,其中包含与“智慧环境”和“智慧移动”特征相关的术语。0跟踪:社交感知和企业智能 朝着智能企业转型 WWW 2018年4月23日至27日,法国里昂17240图4:带有SCC的领域知识库的一部分(智能环境和智能移动术语的子集)0算法1 链接算法01: 对于每个SCC Sj02: 构建领域知识库Kj03: 对于每个法规Oi,进行法规链接05: Li, j ← � x ∈ Kj C (Oi, x)06: 将Oi分配给j = argmax j Li, j的Sj07: 对于每个社交媒体发布Ti,进行社交媒体链接09: Mi, j ← � x ∈ Kj C (Ti, x)010: 将Ti分配给j = argmax j Mi, j的Sj011: O ← {(Oi, Tk) | � Sj: (Oi分配给Sj) ∧ (Tk分配给Sj)}012: 返回O � 法规和社交媒体之间的链接03.2 使用SCC和CSK进行链接0使用这些领域知识库,使用CSK概念将法规文本T中的术语x与SCC进行语义关联。我们将其表示为C(T,x)。例如,如果法规文本中包含术语“烟雾探测器”,则CSK概念可以通过烟雾探测器的CSK属性与智能环境的SCC进行语义关联。这些信息可以在从SCC和CSK来源派生的领域知识库中找到。同一法规也可能具有与其他SCC相关的特征。法规中的某些术语可能与多个SCC重叠。在这种情况下,它们将在每个SCC的知识库中被观察到。如果在法规中发现这些概念术语,它们的出现次数将计入多个类别。例如,如果一个法规中出现了术语“可持续性”,那么该法规将被计入智能移动性和智能环境的特征中(见图4)。因此,在这个特定的例子中,这两个SCC的计数将被更新。最后,检查所有聚合SCC计数,并将每个法规与具有最大相关特征数量的SCC相应地链接起来。CSK在通过概念、属性等找到此映射的语义相关性方面起着关键作用。同样,我们通过类似的CSK引导过程将推文映射到SCC。通过这样做,我们最终的目标是0通过相互的SCC连接,将法规和推文之间的链接输出。因此,我们强调:如果一项法规和一个推文都映射到相同的SCC,则该法规广泛地与该推文相关联。此用于链接它们的映射方法在此通过算法1进行总结。目前为止,为了简单起见,我们只将最匹配的SCC作为法规和推文的输出。04 映射的评估0我们使用公开可访问的法规和推文网站上的大量真实数据对使用SCC进行法规和推文的映射进行评估。我们的实验评估摘要如下所示。04.1 法规到SCC的映射0大量的历史法规数据是从纽约市议会的网站[3]上收集的,这些数据对公众是开放的。图5中显示了其中的一小部分。这些法规首先被提取为机器可读的形式,然后经过预处理步骤,只保留它们的文本内容。在预处理阶段,诸如“主要发起人”、“议会成员发起人”等属性(见图5)被过滤掉。法规的文本内容0跟踪:社交感知和企业智能 朝着智能企业转型 WWW 2018年4月23日至27日,法国里昂17250图5:纽约市议会网站样本0表1:一份样本条例及其SCC映射0智能城市特征术语计数0经济1 环境0 治理15 人民0 流动性0 居住00然后,这些条例作为输入传递给我们的算法,该算法进行条例到SCC的映射。该算法与SCC知识库进行接口,并使用相关术语进行映射。这个映射过程在算法1中得到了正式化。它相应地计算所有这样的匹配项,并将具有最大计数的SCC作为最接近匹配的SCC输出。这里展示了一份来自上述纽约市议会网站的条例摘录(Ord.1),以及基于计算具有SCC特征的相关条例术语的最接近匹配的SCC(表1)。0Ord.1:一项修改纽约市行政法典的地方法案,涉及修改市中心-下曼哈顿商业改进区的区域规划...0根据这个条例摘录,我们的算法依赖于SCC领域知识库,并得出结论,与“智能经济”特征相关的唯一术语是“商业”,而与“智能治理”相关的术语有很多,包括“法律”,“行政”,“区域规划”,“改进”等,如表1所总结的那样。因此,在这个例子中返回的最接近匹配的SCC是“智能治理”。随后分析了许多其他条例,都按照相同的模式进行。需要注意的是,到目前为止,我们的执行中只有最接近匹配的条例才作为输入,然后由我们的算法进行条例到SCC映射。该算法与SCC知识库进行接口,并使用相关术语进行映射。这个映射过程在算法1中得到了正式化。它相应地计算所有这样的匹配项,并将具有最大计数的SCC作为最接近匹配的SCC输出。这里展示了一份来自上述纽约市议会网站的条例摘录(Ord.1),以及基于计算具有SCC特征的相关条例术语的最接近匹配的SCC(表1)。0为简单起见,SCC被提供作为条例映射输出。推文到SCC的映射也是如此。我们评估了一个包含两个最近的条例会议的纽约市议会数据子集,即2006年至2009年和2010年至2013年。根据这个评估,我们得到了图6中给出的条例到SCC映射的摘要图。0图6:条例SCC映射摘要图0这个摘要图中的观察结果对于向城市管理机构提供关于他们的条例在智能城市各个方面的关注程度的反馈是有用的。例如,从结果可以得出结论,在第一个会议中,最受关注的智能城市特征是“智能生活”,而在第二个会议中,最受关注的是“智能治理”。在这两个会议中,最少关注的SCC应该是“智能人民”。这可能有助于城市机构制定未来的政策,使其在迄今为止相对较少关注的特征方面取得进展,例如“智能人民”特征。关于城市立法在这方面的各个方面的影响的详细信息出现在[13]中,主要涉及特定领域的角度。0主题:社交感知和企业智能 迈向智能企业转型 WWW 2018年4月23日至27日,法国里昂17260这是我们目前关于条例、推文和SCC的研究的一个重要动机。04.2 推文到SCC映射0我们从Twitter上提取了数千条与纽约市特定位置数据相关的公众发布的推文。使用Twitter的流式API功能“过滤实时推文”进行提取。将推文提取到文本文件中,并使用正则表达式等NLP技术进行进一步处理。保留推文的相关部分,如文本内容和超链接。这些被存储为清理后的推文。然后,使用我们的方法的相关部分对清理后的推文进行SCC映射,如算法1所示。在图7中,我们展示了在我们的实验中提取的1000多条推文中使用的一小部分清理后的推文。0图7:从纽约市站点分析的推文子集0基于这些推文,图8描述了我们的程序将这些清理后的推文映射到最相关的SCC的部分快照,参考了算法1中的相关部分过程。其解释如下。在此处理的推文中,整体映射表明其中37个属于智能经济,25个属于智能环境,208个属于智能生活等。这些结果是通过图中所示的处理获得的,例如,智能生活SCC的特征包括诸如“家庭”、“福利”、“游客”、“建筑”等术语,而智能环境的特征包括“能源”、“可持续”等术语(这些术语是使用CSK和SCC来源构建的知识库获得的)。从图中可以看出,在总体上,有352个推文被映射到SCC(37+25+...+208)。因此,在这些实验中分析的大约1000个清理后的推文中,有许多推文没有映射到任何SCC。这可能是因为用户发布的并不是所有推文都与SCC相关。也可能是因为在初始实验中没有准确识别出一些映射。0图8:推文到SCC映射的部分快照04.3 评估和讨论0为了便于判断映射的正确性,我们在初始执行中开发了非常简单的GUI。我们在下面展示了Tweet MappingGUI的相关部分。它接受推文作为输入,并将用户最接近的匹配SCC作为输出,如果没有匹配,则输出“无匹配项”。图9显示了一个推文及其被识别为智能环境的SCC的示例,而图10给出了一个不匹配的推文示例。这两个都是部分GUI截图。0图9:SCC映射的示例0图10:没有任何SCC匹配的示例0考虑到输入的几个推文和通过此GUI识别的SCC,这些映射的正确性由地球和环境研究领域的专家进行评估。为了实现一目了然的显示,还提供了类似的法令映射GUI用于法令到SCC的映射。这些映射也由领域专家进行评估。实际的准确度计算使用以下准确度指标进行。考虑到领域专家提供的判断0跟踪:社交感知和企业智能 朝着智能企业转型 WWW 2018,2018年4月23日至27日,法国里昂17270表2:法令和推文映射的准确度0法令推文0专家1 84% 72% 专家2 86%69% 专家3 81% 70%0专家,如果一项法令或推文通过我们提出的方法映射到给定的SCC(或者返回无匹配项),并且专家验证为正确,则被视为真实映射(TM)。如果专家将此映射标记为不正确,则为错误映射(FM)。例如,如果该方法指示SCC为智能治理,但专家表示它是智能经济或无匹配项,则为错误映射。同样,如果该方法指示无匹配项,但专家表示它映射到给定的SCC,则仍被视为错误映射。换句话说,数据的真实性由专家为所分析的数据定义。基于这个理由,我们继续计算0准确度 = T0TM + FM,(1)0并且这被用于衡量我们提出的映射方法的有效性。这类似于数据挖掘和机器学习技术中的真正和假正例的经典概念[36]。(在我们的研究中,我们暂时不考虑真负例和假负例,因为它们的适当定义需要进一步的洞察和与领域专家的讨论。这是未来工作的一个方面)。根据此处给定的准确度定义,我们获得了如表2所列的评估分数。因此,通过领域专家验证,法令到SCC的映射在大约85%的法令中被发现是准确的。整体而言,这被认为是令人满意的,尽管还有改进的空间。差异的主要原因是一些法令实际上几乎可以等同地映射到多个SCC,因此我们的方法可能将一个特定的SCC识别为最佳匹配,而专家则识别另一个。推文到SCC的映射的准确度在70%左右的范围内,对于一个起点来说似乎相当合理。然而,它远低于法令到SCC的映射。下面是一些被错误分类或返回无匹配项的推文示例,从而对我们的方法中推文到SCC映射的性能产生不利影响。0•"风速0.0英里/小时,北风。气压30.134英寸,缓慢下降。温度26.1°F。今天降雨量0.00英寸。湿度94%" • "RT @worldclassEXO:听着,文在寅,即韩国总统,不会允许SM贿赂奥运会,因为那会破坏国家的声誉..." • "@FoxNews 在修建墙之前不会有DACA。" •"我们二月份的STEM英雄是... #STEMed #STEM #SciEd#ScienceEd @polyprep https://9O7Gf5sZP7..."0检查这些示例,一个重要的观察是,不准确映射(或找不到匹配项)的问题主要是由于挑战,如歧义性、非正式语言、过度使用首字母缩写和标签等所导致的。这些问题在执行映射时带来了重大挑战。0对推文到SCC映射过程的进一步研究的呼吁。我们在研究的推文映射部分遇到了下面列出的挑战。0(1) 推文使用非正式语言,使其提取和分析变得困难。(2)推文受到长度限制,导致用户过度使用首字母缩写。(3)覆盖范围有限,例如,网络上1/3的提及无法链接到维基百科(约30%的损失)。(4)NEE(命名实体提取)和NED(命名实体消歧)涉及许多不确定性程度。0解决这些非平凡的挑战,同时旨在提高法令到SCC映射的准确性,并考虑通过排名对多个SCC的语义接近性,构成了我们正在进行的工作。我们还希望在映射中进一步细化,这将涉及识别SCC中个别特征的细粒度方面,而不仅仅是整个SCC本身。这可能会带来更好的性能。05 结论0本文提出了一种基于智慧城市特征(SCCs)的方法,将法令映射到表达公众意见的推文上。我们的方法的初步实验执行结果显示,法令到SCC的映射准确率约为85%,而推文到SCC的映射准确率约为70%,这些结果都得到了领域专家的确认。正在进行的研究包括解决推文到SCC映射中的挑战,提高法令到SCC映射的准确性,考虑将法令和推文映射到多个SCC并进行排名,以及在此基础上实现更细粒度的映射。这将使我们能够从结果中得出更具体的结论,特别是当它们用于推文的极性分类以评估公众反应时。我们研究的长期愿景是为城市机构提供有关他们在政策决策方面的表现如何(基于这种挖掘),从而指示给定的城市地区朝着智慧城市的方向发展的程度。总之,我们的研究做出了以下贡献:0(1)通过推文研究地方法律或法令及其公众反应,为城市机构提供有用的反馈,这是该领域的开创性工作;(2)提出了一种使用智慧城市特征作为纽带的法令到推文映射方法,利用它们之间的语义相关性的传递性;(3)使用纽约市议会的真实法令数据进行研究,映射准确率分别为85%(法令到SCC)和70%(推文到SCC);(4)引发了将法令和推文映射到多个SCC并进行排名的需求,并处理SCC特征的更细粒度级别以提高性能。0最终,我们将我们的工作视为对整个智慧城市发展的贡献,具有更广泛的影响。0跟踪:社交感知和企业智能 朝着智能企业转型 WWW 2018年4月23日至27日,法国里昂17280致谢0我们感谢来自艾伦人工智能研究所(华盛顿州西雅图)的NiketTandon对本研究的宝贵意见。我们感谢蒙特克莱尔州立大学地球与环境研究部门的Robert Taylor和ClementAlo对本研究的反馈。AparnaVarde在2015年8月作为访问研究员访问了德国萨尔布吕肯的马克斯普朗克计算机科学研究所(Max Planck Institute forInformatics),并在GerhardWeikum的小组中开始了这个项目的早期工作。Gerard deMelo在罗格斯大学的研究部分资助来自ARO资助号W911NF-17-C-0098,作为DARPA SocialSim计划的一部分。Manish Puri和XuDu分别在蒙特克莱尔州立大学获得计算机科学的研究助理奖学金和环境管理的博士助理奖学金。0参考文献0[1] Christoph Böhm, Gerard de Melo, Felix Naumann和Gerhard Weikum. 2012.LINDA: 分布式数据规模的实体匹配. 《第21届ACM信息与知识管理会议论文集(CIKM2012)》. Xue-wen Chen, Guy Lebanon, Haixun Wang和Mohammed J. Zaki(主编).ACM, 纽约, 美国. [2] Zhu Cao, Linlin Wang和Gerard de Melo. 2018.基于子图嵌入的凸矩阵补全的链接预测. 《第32届AAAI人工智能会议论文集(AAAI2018)》. AAAI Press. [3] 纽约市议会. 2018. 立法研究中心网页. (2018).于2018年3月4日检索自http://legistar.council.nyc.gov/ [4] Gerard de Melo. 2013.并非完全相同:面向链接数据网络的身份约束. 《第27届AAAI人工智能会议论文集(AAAI2013)》. Marie desJardins和Michael L. Littman(主编). AAAI Press, Menlo Park,CA, 美国, 1092–1098. http://www.aaai.org/ocs/index.php/AAAI/AAAI13/paper/view/6491 [5] Gerard de Melo. 2017. 词、句子和文档的多语言向量表示.《IJCNLP 2017论文集》. http://www.aclweb. org/anthology/I17-5002 [6] Gerard deMelo, Mouna Kacimi和Aparna Varde. 2015. 数据管理和相关领域的论文研究问题.《SIGMOD Record》44, 4(2015年12月).http://sigmod.org/publications/sigmodRecord/1512/pdfs/09_reports_ Melo.pdf [7]Gerard de Melo和Gerhard Weikum. 2008. 语言作为语义网络的基础.《第7届国际语义网会议(ISWC 2008)海报和演示会议论文集(CEUR WS)》. ChristianBizer和Anupam Joshi(主编),Vol. 401. CEUR, 德国卡尔斯鲁厄. [8] Gerard deMelo和Gerhard Weikum. 2008. 将Roget's Thesaurus和WordNet映射到法语.《第6届语言资源和评估会议论文集(LREC 2008)》. ELRA, 法国巴黎, 3306–3313. [9]Gerard de Melo和Gerhard Weikum. 2010. 解开维基百科的跨语言链接结构.《第48届年度计算语言学协会会议论文集》. Association for Computational Linguistics,Stroudsburg, PA, 美国. [10] Xin Dong和Gerard de Melo. 2018.深度情感分析的跨语言传播. 《第32届AAAI人工智能会议论文集(AAAI 2018)》. AAAIPress. [11] Katherine Rose Driggs-Campbell, Victor Shia和Ruzena Bajcsy. 2014.自主车辆的决策:传感器、通信和控制的整合.《第3届高可信网络系统国际会议论文集(HiCoNS '14)》. ACM, 纽约, 美国, 59–60.https://doi.org/10.1145/ 2566468.2576850 [12] Xu Du, Onyeka Emebo, AparnaVarde, Niket Tandon, Sreyasi Nag Chowdhury和Gerard Weikum. 2016.基于社交媒体和结构化数据的空气质量评估:城市规划中的污染物和健康影响.《IEEE国际数据工程会议(ICDE)-研讨会论文集》. 54–59. [13] Xu Du, DianeLiporace和Aparna Varde. 2017. 具有智能城市特征的数据分析的城市立法评估.《IEEE普适计算、电子和移动通信会议(UEMCON)》. 20–25. [14] ChristianeFellbaum(主编). 1998. 《WordNet: 一种电子词汇数据库》. The MIT Press.http://www.amazon.ca/exec/obidos/redirect?tag=citeulike04-20{&}path=ASIN/026206197X [15] Liangjie Hong和Brian D. Davison. 2010.推特中主题建模的实证研究. 《第一届社交媒体分析研讨会论文集(SOMA '10)》. ACM,纽约, 美国, 80–88. https://doi.org/10.1145/1964858.1964870 [16] IEEE. 2018.IEEE智能城市技术社区. (2018). 于2018年3月4日检索自https://smartcities.ieee.org/0[17] G. Leef. 2007. 智能经济学:关于政府、税收、企业和家庭的50个常识性问题的答案.Foundation for Economic Education. [18] Quanzhi Li, Sameena Shah, Xiaomo Liu,Armineh Nourbakhsh, and Rui Fang. 2016. TweetSift:基于实体知识库和主题增强词嵌入的推文主题分类. In第25届ACM国际信息与知识管理会议论文集(CIKM '16). ACM, 美国纽约, 2429–2432.https://doi.org/10.1145/2983323.2983325 [19] TU Wien (维也纳技术大学). 2015.欧洲智能城市,技术报告. 技术报告. 奥地利维也纳. [20] Michael Pawlish and AparnaVarde. 2010. 自由冷却:数据中心的范式转变. InIEEE可持续性信息与自动化国际会议(ICIAfS). 347–352. [21] Michael J. Pawlish, Aparna S.Varde, and Stefan A. Robila. 2015. 云技术下数据中心的绿色化. 国际云应用与计算杂志. 5,4 (2015年10月), 1–23. https://doi.org/10.4018/IJCAC.2015100101 [22] Priya Persaud,Aparna Varde, and Stefan Robila. 2017.以常识增强自动驾驶车辆:智能城市中的智能移动性. In IEEE人工智能工具国际会议(ICTAI)- 智能城市研讨会. [23] Andi Rexha, Mark Kröll, Mauro Dragoni, and Roman Kern.2016. 推文中目标短语的极性分类:一种基于Word2Vec的方法. In 语义Web - ESWC2016卫星活动, 希腊克里特岛希拉克利翁, 2016年5月29日-6月2日,修订选定论文集(计算机科学讲义), Harald Sack, Giuseppe Rizzo, Nadine Steinmetz,Dunja Mladenic, Sören Auer, and Christoph Lange (Eds.), Vol. 9989. 217–223.https://doi.org/10.1007/978-3-319-47602-5_40 [24] Jacobo Rouces, Gerard de Melo,and Katja Hose. 2015. 用FrameBase表示专业事件. In第4届语义Web中检测、表示和利用事件国际研讨会(DeRiVE 2015)在ESWC 2015上.http://ceur-ws.org/Vol-1363/paper_7.pdf [25] Jacobo Rouces, Gerard de Melo, andKatja Hose. 2016. 复杂模式映射和链接数据:超越二元谓词. In WWW2016链接数据网络研讨会论文集(LDOW 2016)的论文集. [26] Jacobo Rouces, Gerard deMelo, and Katja Hose. 2016. 通过FrameBase连接异构知识的启发式方法. In ESWC2016论文集(计算机科学讲义). Springer. [27] Niket Tandon and Gerard de Melo. 2010.从Web规模的N-Gram数据中提取信息. In Web N-Gram研讨会. 第33届年度国际ACMSIGIR信息检索研究与开发会议研讨会, Chengxiang Zhai, David Yarowsky, EvelyneViegas, K
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- IEEE 14总线系统Simulink模型开发指南与案例研究
- STLinkV2.J16.S4固件更新与应用指南
- Java并发处理的实用示例分析
- Linux下简化部署与日志查看的Shell脚本工具
- Maven增量编译技术详解及应用示例
- MyEclipse 2021.5.24a最新版本发布
- Indore探索前端代码库使用指南与开发环境搭建
- 电子技术基础数字部分PPT课件第六版康华光
- MySQL 8.0.25版本可视化安装包详细介绍
- 易语言实现主流搜索引擎快速集成
- 使用asyncio-sse包装器实现服务器事件推送简易指南
- Java高级开发工程师面试要点总结
- R语言项目ClearningData-Proj1的数据处理
- VFP成本费用计算系统源码及论文全面解析
- Qt5与C++打造书籍管理系统教程
- React 应用入门:开发、测试及生产部署教程
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功