李德毅院士谈大数据挖掘:新时代的技术与文化变革

5星 · 超过95%的资源 需积分: 9 19 下载量 86 浏览量 更新于2024-07-23 1 收藏 26.06MB PPTX 举报
"李德毅院士在第六届中国云计算大会上探讨了大数据挖掘如何引领时代变革,指出大数据不仅是技术层面的革新,如数据库、存储和挖掘技术的进步,更是数据资源价值的深度挖掘与转换,以及文化和精神层面的新变化。大数据时代带来了PB级别的科学挑战,主要数据来源包括自然界的地球大数据、生命及生物大数据以及社交网络产生的大数据。在这个背景下,数据挖掘面临着包括人脸识别在内的非结构化数据处理难题。回顾计算机发展历史,从图灵模型到计算时代的演进,计算性能的提升推动了存储和输入输出的发展,但早期主要关注结构化数据的挖掘。随着大数据的崛起,未来将更加注重非结构化数据的处理和价值提取。" 李德毅院士的演讲核心围绕大数据的深远影响展开。他首先强调,大数据不仅仅意味着技术进步,如在数据库管理系统、数据存储技术和数据挖掘算法上的创新,更重要的是对数据资源价值的全新认识。大数据的价值不仅限于技术层面,它改变了我们看待数据资源的方式,引发了对数据潜在价值的深度挖掘和转换,同时影响了社会文化和精神层面。这预示着一个全新的时代,其中数据成为驱动变革的关键因素。 大数据的来源广泛,包括地球观测产生的数据、生物学领域的生命及生物大数据,以及社交媒体生成的社交大数据。这些数据的海量性提出了PB级别的科学挑战,特别是在数据挖掘领域。例如,人脸识别技术在处理大量摄像头记录的流媒体数据时,面临非结构化数据的关联分析、算法准确率等问题。 回顾计算机的历史,李德毅院士提到,从1936年的图灵模型开始,计算、操作系统和存储的发展构成了计算机的基石。在计算时代,计算性能的提升遵循摩尔定律,极大地推动了存储和输入输出设备的进步。然而,在这个阶段,数据挖掘主要集中在结构化数据上,而非如今大数据时代所面临的非结构化数据处理。 随着大数据的兴起,未来的计算机科学和技术将更加专注于解决非结构化数据的挑战,如如何有效提取、分析和利用社交网络、图像和视频等复杂数据中的信息。这要求我们在技术和理论层面进行突破,开发适应大数据特性的新型数据处理和挖掘技术,以应对这一新时代的挑战。