没有合适的资源?快使用搜索试试~ 我知道了~
4370SoBigData:社交挖掘和大数据生态系统0Fosca GiannottiKDD实验室,ISTI -CNR比萨,意大利fosca.giannotti@isti.cnr.it0Roberto TrasartiKDD实验室,ISTI -CNR比萨,意大利roberto.trasarti@isti.cnr.it0KalinaBontcheva计算机科学系,英国谢菲尔德k.bontcheva@sheffield.ac.uk0Valerio GrossiKDD实验室,ISTI -CNR比萨,意大利valerio.grossi@isti.cnr.it0摘要0科学家们今天面临的最紧迫和最迷人的挑战之一是理解我们全球互联的复杂社会。从人类活动的数字面包屑中产生的大数据具有提供强大社会显微镜的潜力,可以帮助我们理解许多复杂和隐藏的社会经济现象。这样的挑战需要在所有上述社会维度上进行高级分析、建模和推理。与目前普遍利用大数据进行商业目的或更糟的社会控制和监视相比,有必要利用这些机会进行科学进步和社会福祉。除了数据科学家的稀缺性之外,实现这一目标的主要障碍是缺乏一个大规模开放的生态系统,可以进行大数据和社交挖掘研究。SoBigData研究基础设施(RI)为伦理敏感的科学发现和社交数据挖掘的高级应用提供了一个集成的生态系统,这些应用涉及"大数据"记录的社会生活的各个维度。研究界使用SoBigData设施作为大规模社会数据分析和模拟实验的"安全数字风洞"。SoBigData推动可重复和开放的科学,并通过提供:i)一个不断增长的、分布式的数据生态系统,用于采购、访问、策划和管理大规模社交数据,以支持伦理敏感的社交数据挖掘研究;ii)一个不断增长的、可互操作的、社交数据挖掘方法和相关技能的平台:工具、方法和服务,用于挖掘、分析和可视化复杂和海量数据集,克服技术和法律上的障碍,以实现大数据在社交挖掘中的安全部署;iii)一个生态系统,在这个生态系统中,个人信息的保护和对基本人权的尊重可以与对同一信息进行广泛和核心社会利益的科学目的的安全使用相结合。SoBigData设有专门的伦理和法律委员会,该委员会正在实施一个法律和伦理框架。0本文发表在Creative Commons Attribution 4.0 International (CC BY4.0)许可下。作者保留在个人和公司网站上传播作品的权利,并附上适当的归属。WWW2018,2018年4月23日至27日,法国里昂 © 2018IW3C2(国际万维网会议委员会),根据Creative Commons CC BY 4.0许可发布。ACMISBN 978-1-4503-5639-8/18/04.. https://doi.org/10.1145/3184558.31862050CCS概念0• 信息系统 → 信息系统应用;0关键词0欧洲项目;社交挖掘;社交数据;伦理学;大数据0ACM参考格式:Fosca Giannotti,Roberto Trasarti,KalinaBontcheva和ValerioGrossi。2018年。SoBigData:社交挖掘和大数据生态系统。在2018年网络会议上,2018年4月23日至27日,法国里昂。ACM,纽约,美国,2页。https://doi.org/10.1145/3184558.31862050项目信息0缩写:SoBigData;持续时间:从2015年9月1日至2019年8月30日;规模:600万;资助机构:H2020计划;Gn.654024;官方网站:www.sobigdata.eu0首席研究员0FoscaGiannotti(女)是意大利国家研究委员会ISTI-CNR的研究主任。她是多个出版物(超过200篇)的作者,并在数据库和数据挖掘领域的主要会议的科学委员会中任职。KalinaBontcheva(女)是谢菲尔德大学的高级研究科学家,拥有享有声誉的EPSRC职业加速奖学金,从事社交媒体的文本挖掘和摘要。DinoPedreschi(男)是比萨大学的计算机科学教授和移动数据挖掘、社交网络挖掘和隐私保护数据挖掘的先驱科学家。GennadyAndrienko(男)是领导科学家,负责视觉分析研究,并担任伦敦城市大学的全职教授。MarlonDumas(男)是软件工程教授,是欧洲五位引用最高的软件工程研究人员之一。GuidoCaldarelli(男)将担任研究团队负责人,并在理论网络分析方面工作。WolfgangNejdl(男)自1995年以来一直担任计算机科学的全职教授。他是L3S研究中心和分布式系统研究所/知识基于系统的负责人。TobiasBlanke(男)是数字人文学系的高级讲师,他的学术背景是哲学和计算机科学。0国际项目WWW 2018,2018年4月23日至27日,法国里昂4380FabrizioLillo(男)目前是意大利斯库拉诺马莱大学的金融数学教授,研究金融市场的微观结构和高频金融。AristidesGionis(男)是赫尔辛基信息技术研究所算法数据分析项目的副教授和主任。DirkHelbing(男)在自然科学、工程科学和社会科学部门工作,并担任社会学、建模和仿真的全职教授。Jeroen van denHoven(男)是道尔夫特理工大学的道德哲学教授和3TU.Ethics的科学主任。0SOBIGDATA的目标和时间表0主要目标是向多学科科学家、创新者、公共机构、公民组织、中小企业以及各级数据科学学生提供对SoBigDataRI的访问(包括虚拟和跨国现场)。该项目正在创建一个新的欧洲电子基础设施,包括数据科学家的虚拟研究环境、统一格式的大型数据集以及数百个分布式、可互操作的分析和可视化服务,可通过共同的接口访问。SoBigData建立在电子基础设施、相关欧洲数据基础设施和七个已建立的国家基础设施和数据中心的专业知识和最新进展的基础上,这些基础设施和数据中心组织在以下六个主题集群中,涉及社交挖掘和大数据分析的不同研究领域(文本和社交媒体挖掘-TSMM;社交网络分析-SNA;人类移动性分析-HMA;网络分析-WA;可视分析-VA;社交数据-SD)。以下国家基础设施已经整合:0图1:SoBigData资源和访问机会0SoBigData.it是欧洲大数据分析和社交挖掘实验室的知识基础设施,由意大利国家研究委员会的两个研究所和比萨大学资助,提供关于TSMM、SNA、HMA、WA的数据、服务和专业知识。GATECloud是谢菲尔德大学的基于云的大规模自然语言处理和文本挖掘基础设施,提供关于TSMM的数据、服务和专业知识。IVAS是弗劳恩霍夫竞争中心的信息可视化和可视分析的服务器基础设施,提供关于VA的数据、服务和专业知识。亚历山大是莱布尼兹大学的网络科学基础设施,提供关于WA的数据、服务和专业知识。AALTO是赫尔辛基阿尔托大学的社会物理学和数据挖掘实验室,提供关于SNA的数据、服务和专业知识。E-Gov.data是塔尔图大学的中心,负责管理爱沙尼亚电子政府和电子健康数据,提供对这些独特数据集长达10年的访问和服务(SD)。0Living Archive for OpenData,由苏黎世联邦理工学院(SD)社会学系提供的开放数据搜索引擎。0SoBigData具有强烈的伦理动机。我们正在建立一个生态系统,在这个生态系统中,个人信息的保护和对基本人权的尊重与对同样信息的科学目的的安全使用相互共存,这些科学目的具有广泛和核心的社会利益。在项目的所有部分和所有合作伙伴中,我们都非常谨慎,不仅要确保符合相关法律、法规和行为准则,还要通过对道德问题的持续分析,防止所设想的前沿研究和应用产生不道德的结果,这些道德问题对于信息技术的法律、法规和治理构成了持续的挑战。SoBigData追求欧盟正在发展的负责任研究和创新的观点,并将驱动欧盟数据保护立法的持续改革的价值观具体化。SoBigDataRI管理着垂直的主题环境,称为探索性环境,位于SoBigData基础设施之上,用于进行跨学科的社会挖掘研究:0市民之城:这个探索性环境通过数据、统计和模型来描述城市和居住在其中的人们。幸福与经济:大数据能帮助我们理解经济和日常生活习惯之间的关系吗?我们使用超市购买数据,研究人们的行为。社会辩论:这个探索性环境研究社交媒体和报纸上的公共辩论。它通过跟踪讨论主题并追踪它们的时间和空间来识别主题。移民研究:大数据能帮助我们理解移民现象吗?我们试图回答一些关于欧洲和世界各地移民的问题。体育数据科学:这个探索性环境通过数据、统计和模型来讲述体育分析的故事。体育数据科学家可以更好地理解和提升体育表现,从而使教练、球迷和从业者受益。0图2:SoBigData项目组织0截至2018年1月,SoBigData平台上已经包含了120多个资源,包括在其平台上发布的方法和数据集,并且这个数字还在不断增长,得益于原始合作伙伴和新组织和用户之间的合作。该平台现在已经达到了一千名用户,这对于一个年轻的平台来说只是一个良好的开始,在接下来的一年中将会有很大的改进(得益于传播和整合新资源)。这个欧洲电子基础设施最终将包括一个虚拟的研究环境,供数据科学家使用,统一格式的大型数据集,以及数百个分布式、可互操作的分析和可视化服务,通过共同的接口进行访问。0本论文得到SoBigData.eu的支持,H2020计划编号为654024。0国际项目WWW 2018,2018年4月23日至27日,法国里昂
下载后可阅读完整内容,剩余1页未读,立即下载
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)