百度大规模检索系统：容器配额调度策略优化

需积分: 9 154 浏览量更新于2024-07-17 收藏 4.12MB PDF 举报

"这篇文档是百度共享技术平台部的耿关辉关于百度大规模检索系统容器配额调度策略调优的演讲稿。耿关辉在百度担任容量管理方向的技术负责人，有着丰富的运维技术经验，特别是在海量业务集群的容量建模、测量、规划和优化方面。文档讨论了在混布集群中如何解决碎片问题，以及如何优化资源分配和利用率，以支持每日千亿级别的请求和覆盖6亿用户的多个产品。" 文档中提出了大规模检索系统面临的主要挑战：如何在资源分配率和利用率之间找到平衡。一方面，统一标准尺寸的容器策略可能不适用于所有情况；另一方面，按比例设置容器资源或让用户自定义可能会导致资源浪费或利用率低下。同时，文献中提到了索引分片、IDC成本优化和多维向量分箱等领域的相关研究。耿关辉探讨了“容器配额调度的问题定义”，其目标是在满足服务需求的同时，最小化所使用的机器资源总量。他将问题简化为确定每个service实例的资源分配、实例数量和分布。CPU被视为与负载相关的恒定量，而内存(MEM)和固态硬盘(SSD)则取决于service本身的特性。在权衡实例数量时，增加实例可以降低单实例CPU消耗，但过多的实例可能导致内存和SSD成为瓶颈，影响整体效率。在解决这一问题的过程中，文档提到了两种调度算法：贪婪算法的FirstFitDecreasing (FFD) 和Bin-Centric方法。FFD按照容器大小降序排列，依次尝试在机器上放置容器，直至找到符合约束的机器。而Bin-Centric算法更注重资源需求与机器剩余容量之间的耦合，每次都试图填满机器。通过容器尺寸的调整、实例数的确定以及容器分布的优化，这些调度策略旨在提高资源利用率，减少碎片，同时保证检索系统的稳定性和效率。在实际应用中，冷启动和热启动场景下的实例管理和容器部署策略也是关键因素，它们直接影响到配额调度的效果。这篇文档深入探讨了百度大规模检索系统中的容器配额调度策略，为解决大规模集群中的资源优化问题提供了有价值的见解和实践方法。

相关工作和研究

Ø  常见的配额策略

–  统一为标准尺寸（大规模系统上并不总是可达）

–  按比例设置容器资源（borg，k8s）

–  交由用户定制（EC2等公有云，Mesos，随机、或根据经验）

p  相关工作

–  索引分片问题：索引切分、压缩、缓存技术，更多关注在数据处理层面

–  IDC成本优化：能耗优化、任务混布

（Google，

Acm Transactions on Computer Systems ，2016

）

–  容器分布算法： multi-dimensional vector bin packing

剩余25页未读，继续阅读

良月二十三

粉丝: 76
资源: 174

百度大规模检索系统：容器配额调度策略优化

大规模检索系统的容器配额调度策略调优.pdf

J2EE应用性能调优.docx

Design.And.Implementation.Of.The.4.4.Bsd.Operating.System.-.Part.1.pdf

瑞信-中国-包装纸行业-中国包装纸行业：浪费进口配额来抬高价格-2019.12.13-28页.pdf

linux系统管理--磁盘管理和配额.pdf

Docker 应用：如何设计超大规模容器调度系统（19页）.pdf

论文研究-物联网环境下碳配额和减排双重约束的企业资源共享策略.pdf

DS-8132HWS-SH硬盘录像机终稿.pdf

8-5磁盘容量配额.pdf

基础化工行业周报年氢氟碳化物配额总量设定与分配实施方案征求意见稿出炉-13页.pdf.zip

最新资源