Skip to content
Robin's AI Lab
Search
⌘
Ctrl
K
Main Navigation
首页
AI 技术
🦙 大语言模型
🤗 强化微调
✌️ 推理部署
🏗️ 模型架构
🚀 大规模并行
🍭 扩散模型
🍔 多模态
🍒 强化学习
🇨🇳 Ascend生态
更多
⚒️ 效率工具
📖 深度学习百科
🤖 机器学习百科
🔗 外部链接
主题切换
菜单
回到顶部
文章目录
分布式训练
分布式训练基础
从使用者角度切入
Horovodrun背后做了什么
网络基础 & Driver
融合框架
后台线程架构
DistributedOptimizer
On spark
启动 on spark
弹性训练总体架构
弹性训练之Driver
弹性训练发现节点&State
广播 & 通知
弹性训练之Worker生命周期
弹性训练之容错
MPI