大数据应用实战:克服平民化难题与提升效率
需积分: 15 123 浏览量
更新于2024-07-23
收藏 1.41MB PDF 举报
孔宇华在"驾驭大数据——如何实现大数据的应用性"演讲中,深入探讨了大数据的普及和应用挑战。他首先指出,大数据的三个核心特性——海量、多样性和高速,使得它成为企业关注的焦点。然而,实现大数据的平民化并非易事,主要障碍包括高昂的研究成本,特别是对于中小型企业而言,定制化Hadoop的优化需要投入大量的人力、物力和时间,这是个难以承受的成本。
演讲中提到了Hadoop的学习曲线问题,Hive虽提供SQL支持,但其功能受限,UDF函数的开发和维护需要较高的技术门槛。此外,Hadoop的实时性较差,更适合离线分析,对于现有的业务平台迁移,如数据仓库中的复杂存储过程,Hadoop可能需要重写,这在短期内并不经济。
孔宇华强调了大数据应用中的“天时”、“地利”和“人和”。数据的价值在于其潜在的商业洞察,而人员、流程和技术则是实现价值的关键。他区分了技术公司和非技术公司在大数据使用上的特点,前者可能拥有更多的计算机科学人才,可以进行复杂的数据处理,后者则更依赖于易于使用且灵活性强的工具。
他特别提到,尽管数据库一直是数据分析的传统选择,SQL因其高级别、可重复使用和适应各种数据库结构的优点在大数据场景下仍然具有价值。然而,SQL在处理某些复杂问题时性能不足,难以表达或理解,这促使业界寻求新的解决方案和编程模型。
因此,孔宇华倡导在部署大数据系统时,既要考虑到技术选型的灵活性和易用性,也要评估实际业务需求,合理规划人员培训和流程改进,确保大数据项目的成功实施并为企业带来实际效益。同时,他还提醒企业在引入大数据时,应充分权衡短期成本与长期价值,避免过度追求技术先进而忽视了实际业务的现实需求。
2021-10-17 上传
2021-07-07 上传
2021-04-24 上传
2020-10-12 上传
2021-10-17 上传
2021-07-07 上传
2021-10-17 上传
admin
- 粉丝: 43
- 资源: 314
最新资源
- 新型智能电加热器:触摸感应与自动温控技术
- 社区物流信息管理系统的毕业设计实现
- VB门诊管理系统设计与实现(附论文与源代码)
- 剪叉式高空作业平台稳定性研究与创新设计
- DAMA CDGA考试必备:真题模拟及章节重点解析
- TaskExplorer:全新升级的系统监控与任务管理工具
- 新型碎纸机进纸间隙调整技术解析
- 有腿移动机器人动作教学与技术存储介质的研究
- 基于遗传算法优化的RBF神经网络分析工具
- Visual Basic入门教程完整版PDF下载
- 海洋岸滩保洁与垃圾清运服务招标文件公示
- 触摸屏测量仪器与粘度测定方法
- PSO多目标优化问题求解代码详解
- 有机硅组合物及差异剥离纸或膜技术分析
- Win10快速关机技巧:去除关机阻止功能
- 创新打印机设计:速释打印头与压纸辊安装拆卸便捷性