#Quantization
3 篇报告
ArXiv ArXiv Daily — 2026-06-05
— Agent 工程化与推理效率优化双主线:SaliMory 认知记忆、UltraEP 机架级 MoE 负载均衡、Q-K=V 投影共享压缩 50% KV Cache
ArXiv ArXiv Daily — 2026-06-04
— Agentic AI 论文大爆发:MIRAGE 隐式推理世界模型、AutoLab 长期任务基准、UltraEP 机架级 MoE 训练
Paper veScale-FSDP 深度解读:让大模型分布式训练的分片方式真正灵活起来
— 字节跳动提出 RaggedShard 灵活分片格式,解决现有 FSDP 元素级/行级分片与块结构计算冲突的根本矛盾,实现 5~66% 吞吐量提升和 16~30% 内存降低