大数据:理解、应用与挑战——施水才的视角

0 下载量 169 浏览量 更新于2024-06-28 收藏 9.37MB PPT 举报
在2024年的五月二十一日,一场名为"理解大数据-实践大数据-施水才[1]"的讲座中,施水才先生探讨了大数据这一关键领域。讲座分为两个主要部分:对大数据的理解以及拓尔思大数据产品布局和应用实践。 首先,施水才先生针对反对派的观点进行了回应,他们认为当前正处于大数据崇拜的时代,但这种崇拜可能盲目。大数据产生的背景包括数据的爆炸式增长、社会化趋势、新摩尔定律的影响,使其成为一种重要的自然资源。机器数据的重要性日益凸显,大数据如果未能有效利用,就会转化为成本。现有的商业软件难以应对大数据的规模和复杂性,需要五个基本能力:获取、存储、搜索、分享和分析,以及数据的可视化。 奥巴马的大数据战略被提及,白宫在2012年发布的大数据计划旨在提升从海量数字数据中提取知识和观点的能力,推动科学与工程进步、增强国家安全,并革新教育研究。大数据的四个关键特性——体量、多样性、价值密度和速度,强调了非结构化数据的庞大增长及其相对于结构化数据的显著优势。非结构化数据占据了总数据量的80%至90%,增长速度远超结构化数据。 大数据的异构性和多样性体现在其多样的数据形式(如文本、图像、视频和机器数据),这些数据通常没有明确的模式,语法或句义不一致,且包含大量无关信息。大数据的价值在于进行深度复杂分析,如机器学习和人工智能,相较于传统的商业智能(如咨询和报告)提供了更精确的未来趋势预测和实时分析能力,这与传统的批量式分析和事后决策形成鲜明对比。 讲座的核心观点围绕大数据的实际应用展开,包括它比云计算更具实用性,强调大数据不仅仅是数据量的大小,而是数据处理和分析能力的体现。软件作为大数据的引擎,其作用不可或缺。此外,施水才先生指出,尽管大数据管理相对容易,但真正理解大数据的含义和潜力却更具挑战性,涉及到数据的深层次理解和利用。这场讲座深入探讨了大数据的理论与实践,展示了其在现代社会中的核心地位和巨大价值。