联想智能超算平台LiCO用户手册:一站式HPC与AI解决方案详解
需积分: 48 143 浏览量
更新于2024-07-18
4
收藏 9.36MB PDF 举报
联想智能超算平台LICO用户手册是一份详细的文档,针对联想开发的基于超性能计算(HPC)集群的解决方案。该平台主要功能涵盖了集群管理、监控、作业调度、用户和账户管理以及文件系统管理等,旨在简化HPC和人工智能(AI)任务的部署和执行。
1. **产品简介**
- LiCO是一个一站式服务,它整合了高性能计算资源,使得用户能够高效地管理和运行各种类型的工作负载,包括通用计算、常见的数值模拟(如MPI、ANSYS、COMSOL)、深度学习任务(TensorFlow、Caffe、Intel Caffe、MXNet、Neon等)以及GPU加速应用。
- 提供了图形化界面和命令行接口,方便不同技能水平的用户操作,包括登录、登出、密码修改、作业提交、AI模型训练等。
2. **核心功能**
- **登录与身份管理**:用户可以通过账户和密码进行登录,并允许修改密码以确保安全性。
- **作业管理**:
- **通用作业**:支持提交标准作业,包括作业程序和容器镜像上传。
- **HPC作业**:支持MPI并行计算,以及ANSYS和COMSOL这类专业软件的作业提交。
- **AI作业**:专门针对深度学习提供了TensorFlow、Caffe等框架的支持,并提供GPU作业监控。
- **作业生命周期管理**:包括取消、重新运行和删除作业,以及训练AI模型的全流程指导。
3. **高级功能**
- **AI图像分类模型训练**:通过详细的步骤说明,指导用户如何导入数据集、创建网络结构、训练模型、调整参数以及模型的测试和导出。
- **自定义模板**:允许用户创建自己的作业模板,方便重复使用和共享。
- **专家模式**:为熟悉命令行的用户提供了更高级别的控制选项,包括命令行提交作业和作业文件编写。
4. **注意事项**
- 文档提醒用户注意特定目录的绝对路径,以及处理作业提交失败、VNC连接问题、SLURM命令的使用、Caffe网络拓扑定义和GPU监控数据的来源等问题。
总结来说,这份用户手册为联想智能超算平台LICO的使用者提供了全面的操作指南,无论是基础用户还是高级开发者,都能找到适应自己需求的功能和解决方案,从而充分利用联想提供的高性能计算和人工智能资源。
211 浏览量
点击了解资源详情
点击了解资源详情
2024-10-26 上传
2024-10-26 上传
234 浏览量
2021-05-18 上传