一、课纲 2天
01生成式AI的算力需求与挑战
02生成式AI的算力服务器开发背景
03生成式AI的算力服务器发展历程
04生成式AI的算力服务器设计指南
4.1 设计原则
4.1.1 应用导向原则
4.1.2 多元开放原则
4.1.3 绿色高效原则
4.1.4 统筹设计原则
4.2 设计指南
4.2.1 多维协同设计
节点层面:
(1)系统架构
(2)OAM模块
(3)UBB基板
(4)硬件设计
(5)散热设计
(6)系统管理
(7)故障诊断
(8)软件平台
集群层面:
(1)集群网络与存储
(2)整机柜
(3)液冷
(4)制冷
(5)运维
4.2.2 全面系统测试
(1)结构测试
(2)散热测试
(3)稳定性测试
(4)软件兼容性测试
4.2.3 性能测评调优
(1)基础性能测试
(2)互连性能测试
(3)模型性能测试
(4)模型性能调优
二、授课方式
理论讲授:通过讲解和演示,使学员掌握课程内容;
实践操作:提供实际操作和实践的机会,使学员能够亲自动手进行实践;
案例分析:通过案例分析,使学员了解课程内容的应用前景和实际效果;
互动讨论:鼓励学员提问、分享经验和见解,促进知识交流与碰撞。