汇报摘要 本周组会主要讨论了以下内容: MEDUSA-1/2 - 训练差异 Overhead - 不仅仅是额外参数overhead,还有大batch_size时的严重overhead 💡 完整内容请查看上方嵌入的 PDF 文档,该文档使用 LaTeX 排版。 相关资源 论文链接: Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads 模型仓库: huggingface