AI与数据治理:释放企业潜力的未来之路

需积分: 10 49 下载量 33 浏览量 更新于2024-07-19 1 收藏 5.28MB PDF 举报
随着人工智能(AI)在2017年的热度飙升,微软在ImageNet视觉识别挑战赛中的突破性成果引起了广泛关注。他们使用深度神经网络将图像分类错误率降至4.94%,首次超越人类的表现,这不仅证实了机器不再仅仅是决策支持工具,而是具备提供可靠答案的能力。Kaggle肺癌检测竞赛则展现了人类专家和软件开发者的协同作用,通过历史数据和模型相结合,加速机器学习的进步,使得集人类智慧于一体的高效系统能在短时间内诞生。 惠普前CEO的话揭示了AI的巨大潜力,指出如果能充分运用现有的知识,公司的盈利将会显著增长。目前,AI的应用主要局限于数据处理和分析,如X->Y的映射,但在未来,它有可能成为集成多种智能、广泛应用于日常生活并持续进化的超级大脑。然而,当前的数据利用仍然存在诸多问题,如数据冗余、分散和缺乏统一管理,导致数据湖变成了数据沼泽,形成了众多孤立的数据孤岛。 为了克服这些问题,数据治理变得尤为重要。数据工程师们需要跨部门协作,统一数据处理流程,例如数据加载、清洗、标准化等,构建数据资产目录,以便于所有用户进行搜索、选择和共享。数据治理的目标是提高数据的可用性和质量,通过定义数据标准和数据工程组件(CDE),将数据分级,形成一个像超市一样的数据生态系统,让用户能够方便、安全地使用数据。 AI领域的知名专家Andrew Ng用比喻的方式阐述机器学习的价值,强调了数据预处理和模型训练的必要性,以及如何通过不断迭代和优化,让机器学习系统逐渐接近人类智慧。在AI与数据治理的结合下,未来的IT行业将更加依赖数据驱动,实现业务的智能化和效率提升,同时也将更好地服务于广大用户,推动社会的数字化进程。