NVIDIA UFM企业版6.15.1用户手册:统一fabric管理

需积分: 0 7 下载量 92 浏览量 更新于2024-06-17 2 收藏 20.18MB PDF 举报
"NVIDIA UFM(Unified Fabric Manager)企业版用户手册(版本6.15.1)提供了全面的指导,以管理和优化InfiniBand规模计算环境中的UFM平台。该手册详细阐述了UFM的各项核心功能、新特性、安装步骤、已知问题以及历史变更,帮助用户有效地利用其强大的织物管理能力。" NVIDIA UFM是专为InfiniBand环境设计的统一织物管理器,其主要目标是提供高效的中央管理控制台,增强对大规模计算网络的可视性和控制力。UFM的优势在于它支持多隔离应用环境,能够进行面向服务的自动资源配置,并具备快速解决问题和无缝故障转移的能力。其开放架构允许与现有网络基础设施灵活集成。 手册中的"Release Notes"部分详细列出了UFM 6.15.1版本的关键特点和新功能,同时也指出了一些不被支持的功能。在安装说明中,不仅提到了支持的设备列表,还明确了系统需求,包括如何从先前版本升级软件。此部分还包含了本版本修复的错误和当前版本已知的问题,以便用户了解可能遇到的挑战。 UFM的软件架构包括多个关键组件,如图形用户界面、客户端API、客户端SDK工具、UFM服务器、子网管理器、SHARP(可扩展层次聚合和还原协议)聚合管理器、性能管理器、设备管理器、UFM开关代理以及通信协议。这些组件协同工作,确保UFM能够有效地监控、配置和保持网络健康状态。 UFM的主要功能模块涵盖织物仪表板,用于实时监控网络状况;织物分段(PKey管理)用于划分网络资源;织物发现和物理视图则帮助用户理解和管理网络结构;中央设备管理提供了一站式的设备控制;监控模块则用于收集性能数据;配置工具允许用户定制网络设置;织物健康模块确保网络的稳定运行;日志记录功能有助于排查问题;最后,高可用性设计保证了UFM服务的连续性。 "Overview"章节深入介绍了UFM如何通过其各功能模块扩展和优化计算网络,强调了UFM在提升管理效率、增强网络控制、提供资源共享等方面的益处。这使得 UF