云原生数据流水线:Agari在企业级应用中的实践与进化
需积分: 5 40 浏览量
更新于2024-06-22
收藏 11.63MB PDF 举报
"《云原生数据流水线:Sid Anand在QCon Shanghai & Tokyo 2016中的分享》是一份关于企业级数据处理和管理的技术文档,由Sid Anand撰写。该文档主要关注云原生环境下数据管道的构建与应用,特别是如何利用现代技术实现高效、安全的数据流转和分析。
Sid Anand作为一名经验丰富的技术专家,他在文中提到的Agari是一家专注于邮件欺诈检测和预防的企业,其核心产品包括邮件元数据分析(email metadata)和信任评分(trust score),以及企业级客户使用的多个版本的电子邮件信任引擎(email trust engine)。在过去的版本中,Agari侧重于批量处理(batch),而在当前版本中,他们已经实现了接近实时的(near-real-time)数据隔离(quarantine)功能,这对于提升业务效率至关重要。
文档详细讨论了数据管道的不同类型,包括用于商业智能(BI)的数据管道,这些管道通常涉及传统的批处理ETL(提取、转换、加载)工具,如MySQL、Oracle、Cassandra等,以及大型数据仓库(data warehouse)如Teradata和Redshift。另一方面,预测性分析的数据管道则更注重实时流处理和机器学习,可能用到Spark、Flink或Apache Beam等分布式计算框架,以及Redis这样的缓存技术。
此外,Agari还展示了如何将这些数据管道应用于实际场景,如Web服务器监控、OLTP数据库操作、报告工具查询以及推荐系统和欺诈检测。他们的数据源广泛,产出的数据产品如搜索排名、新闻推送和防欺诈服务都是基于这些数据管道构建的。
演讲者强调了本次讨论的核心点,即在云原生环境下设计和实施数据管道,如何平衡商业智能的需求(如BI报告)与预测性分析(如实时推荐和欺诈检测),以驱动企业的决策支持和风险控制。
这份文档提供了深入理解云原生数据流水线的关键洞察,展示了如何通过技术创新来优化数据处理流程,帮助企业适应快速变化的业务需求。获取这份技术分享,可以为IT专业人士提供宝贵的参考和实践指导。"
2018-03-22 上传
2021-05-29 上传
2019-08-21 上传
2021-10-10 上传
2021-02-18 上传
2021-10-10 上传
2016-06-01 上传
weixin_44079197
- 粉丝: 1657
- 资源: 598
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常