数据科学五十年:商业驱动与智能化未来的探讨

需积分: 12 12 下载量 137 浏览量 更新于2024-07-15 收藏 1.16MB PDF 举报
"《数据科学五十年》一文回顾了数据科学自诞生以来的发展历程,从John Tukey在半个世纪前对学术统计领域变革的预见开始。Tukey提出了一门新兴学科——数据分析,关注从数据中学习,而Chambers、Cleveland和Breiman等学者则分别倡导数据准备、展现、预测的重要性,推动了数据科学概念的逐渐成型。他们提出的学科,尤其是Cleveland建议的“数据科学”名称,预示了这个领域将超越传统的统计学范畴。 近年来,随着大数据时代的到来,大学如加州大学伯克利分校、纽约大学和密歇根州立大学等纷纷开设数据科学课程,反映了对这一领域商业价值的重视。然而,这些课程的设置更多是基于市场需求,而非智能化发展的需求,可能导致对人工智能和深度学习等关键技术的关注不足。 文章指出,现有的数据科学领域被定义为一个包含数据科学和机器学习的超集,同时也涵盖了大数据处理技术。这种超集的形成更多出于商业目的,而非科研或智能科学的长远规划。这意味着可能错失未来五十年内真正关键的智能化进展。 作者期待,随着数据在科学研究中的日益重要,数据科学不仅仅是领域的扩大,而是科研方法的根本转变。未来的数据科学将不仅限于提升数据分析的工作流程效率,还将深刻影响各学科的研究成果和实践。作者提出了一个不同于当前数据科学计划的新学术领域,它更专注于将数据置于研究的核心,推动统计学和机器学习在学术层面的深化和发展,尽管它们在短期内目标一致,但长期来看,这个新领域将更好地服务于智能科学的发展。 《数据科学五十年》这篇文章探讨了数据科学的历史演变、现状挑战以及未来发展方向,提醒人们在追求商业利益的同时,不应忽视数据科学在智能化进程中的潜在影响和深远意义。"