云原生环境下Yatai MLOps平台实操与应用

版权申诉

5星 · 超过95%的资源 187 浏览量更新于2024-07-04 收藏 9.89MB PDF 举报

云原生上的MLOps平台是一种在云计算环境中实现机器学习模型部署、管理和运营的新方法，旨在简化模型开发到生产环境的流程。Yatai是BentoML提供的一个实例，它是一个云原生的MLOps平台，专注于在云基础设施上高效管理机器学习模型生命周期。这个平台的主要目标是提高效率、灵活性和可扩展性，以适应不断增长的业务需求。在云原生MLOps平台上，核心组件包括： 1. **模型服务器**：如TensorFlow Serving、Triton Inference Server和TorchServe，这些工具允许模型开发者快速地将训练好的模型部署到生产环境。它们支持多种模型格式，提供RESTful API或RPC服务，便于客户端进行输入数据的请求和接收预测结果。 2. **模型文件与输入/输出张量**：模型以文件形式存储，输入和输出张量则是模型与请求数据交互的关键，通过定义明确的数据结构，确保模型能够正确处理数据预处理和后处理。 3. **现实世界ML应用示例**：例如，一个"Hotdog or Not"的应用可能涉及用户ID、审批逻辑等业务特性，以及特征转换（如Embedding Lookup）和数据验证步骤，确保输入数据质量。 4. **业务逻辑集成**：平台允许在模型预测前后嵌入业务规则，如数据库查询、数据清洗等，确保业务上下文的连贯性。 5. **微服务架构**：使用FastAPI等Web服务器，通过复制进程来实现水平扩展，以适应流量增长。然而，这种设计可能导致资源利用率较低，受限于全局解释器锁（GIL），且不支持批量处理。 6. **代码移植**：为了快速部署，开发者可以直接将Jupyter Notebook中的代码移植到Docker镜像中，实现一键部署。 7. **分离关注点**：试图在Web服务器和Model Server之间找到平衡，分离模型与代码，以避免模型和业务逻辑过于紧密耦合，但可能牺牲一定的性能优化。 8. **复杂管道服务**：平台支持预处理器和特征工程，以构建复杂的机器学习流水线，处理完整的数据处理流程。云原生MLOps平台通过结合云基础设施的优势，提供了一个模块化、可扩展的框架，帮助企业在云环境中更有效地进行机器学习模型的部署、维护和优化。这不仅提升了效率，也降低了运营成本，是现代企业应对AI开发挑战的有力工具。

Using a web serving framework

Feature Transformation

Model Inference

Business Logic

Output Transformation

HTTP Request

HTTP Response

FastAPI worker

•

Scale by replicating process

•

Low resource utilization, limited by GIL

•

No batching

•

Directly port code from Jupyter notebook

•

One docker image for deployment

剩余24页未读，继续阅读

Build前沿

粉丝: 751
资源: 2120

云原生环境下Yatai MLOps平台实操与应用

云原生安全技术报告.pdf

云原生资料学习..pdf

云原生_个人介绍.pdf

云原生安全左移实践.pdf

云原生术语词汇表.pdf

云原生安全加固实战.pdf

云原生技术发展概述.pdf

云原生安全研究报告.pdf

云原生最佳实践合集.pdf

云原生中间件技术白皮书.pdf

最新资源