联想智能超算平台LiCO用户手册:一站式HPC与AI解决方案详解

需积分: 48 78 下载量 143 浏览量 更新于2024-07-18 4 收藏 9.36MB PDF 举报
联想智能超算平台LICO用户手册是一份详细的文档,针对联想开发的基于超性能计算(HPC)集群的解决方案。该平台主要功能涵盖了集群管理、监控、作业调度、用户和账户管理以及文件系统管理等,旨在简化HPC和人工智能(AI)任务的部署和执行。 1. **产品简介** - LiCO是一个一站式服务,它整合了高性能计算资源,使得用户能够高效地管理和运行各种类型的工作负载,包括通用计算、常见的数值模拟(如MPI、ANSYS、COMSOL)、深度学习任务(TensorFlow、Caffe、Intel Caffe、MXNet、Neon等)以及GPU加速应用。 - 提供了图形化界面和命令行接口,方便不同技能水平的用户操作,包括登录、登出、密码修改、作业提交、AI模型训练等。 2. **核心功能** - **登录与身份管理**:用户可以通过账户和密码进行登录,并允许修改密码以确保安全性。 - **作业管理**: - **通用作业**:支持提交标准作业,包括作业程序和容器镜像上传。 - **HPC作业**:支持MPI并行计算,以及ANSYS和COMSOL这类专业软件的作业提交。 - **AI作业**:专门针对深度学习提供了TensorFlow、Caffe等框架的支持,并提供GPU作业监控。 - **作业生命周期管理**:包括取消、重新运行和删除作业,以及训练AI模型的全流程指导。 3. **高级功能** - **AI图像分类模型训练**:通过详细的步骤说明,指导用户如何导入数据集、创建网络结构、训练模型、调整参数以及模型的测试和导出。 - **自定义模板**:允许用户创建自己的作业模板,方便重复使用和共享。 - **专家模式**:为熟悉命令行的用户提供了更高级别的控制选项,包括命令行提交作业和作业文件编写。 4. **注意事项** - 文档提醒用户注意特定目录的绝对路径,以及处理作业提交失败、VNC连接问题、SLURM命令的使用、Caffe网络拓扑定义和GPU监控数据的来源等问题。 总结来说,这份用户手册为联想智能超算平台LICO的使用者提供了全面的操作指南,无论是基础用户还是高级开发者,都能找到适应自己需求的功能和解决方案,从而充分利用联想提供的高性能计算和人工智能资源。