AI News Daily

DeepResearch

AI 论文深度解读,共 2 篇

veScale 深度解读:让大模型分布式训练像单机编程一样简单
2026/6/4 — 字节跳动 veScale 让分布式大模型训练回归单 GPU 编程体验——完全一致的单机语义、2.2 倍加速、78% 代码量减少
LLM
veScale-FSDP 深度解读:让大模型分布式训练的分片方式真正灵活起来
2026/6/4 — 字节跳动提出 RaggedShard 灵活分片格式,解决现有 FSDP 元素级/行级分片与块结构计算冲突的根本矛盾,实现 5~66% 吞吐量提升和 16~30% 内存降低
LLMQuantization