集合通信库

MPI 是集合通信库的鼻祖,英伟达 NVIDIA 大量的参考和借鉴 MPI 通信库相关的内容从而提出了业界集合通信库的标杆 NCCL。本将会从 MPI 开始,介绍业界的各种主流集合通信库的变种 XCCL。然后深入地剖析 NCCL 相关的实现算法、对外 API 等,最后还会介绍华为开源的 HCCL 集合通信库。

内容大纲

PPT字幕 需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲小节链接
集合通信库01 通信库基础 MPI 介绍PPT, 视频
集合通信库02 02 业界 XCCL 大串烧 (上)PPT, 视频
集合通信库03 02 业界 XCCL 大串烧 (下)PPT, 视频
集合通信库04 英伟达 NCCL 原理剖析PPT, 视频
集合通信库05 英伟达 NCCL API 介绍PPT, 视频
集合通信库06 NCCL 通信算法与拓扑关系PPT, 视频
集合通信库07 NCCL 双二叉树算法原理PPT, 视频
集合通信库08 华为 HCCL 架构介绍PPT, 视频
集合通信库09 华为 HCCL 拓扑算法PPT, 视频
集合通信库10 通信模型&通信影响PPT, 视频