一聚教程网:一个值得你收藏的教程网站

热门教程

RT-Lynx用半结构化稀疏性削减扩散模型近半FLOPs

时间:2026-05-29 20:51:01 编辑:袖梨 来源:一聚教程网

arXiv:2605.26632v1 公布了一项针对扩散模型推理瓶颈的研究,研究人员提出名为 RT-Lynx 的方法,通过半结构化稀疏性成功削减模型近半 FLOPs。该工作直接切入 Diffusion Transformers (DiT) 在图像生成中计算成本高昂的痛点,试图在不显著牺牲生成质量的前提下,将计算效率推上一个台阶。

为什么现有稀疏化方法在扩散模型上总是碰壁? 以往的工作大多聚焦于权重稀疏化,简单粗暴地将 50% 的权重砍掉。这种做法的弊端很明显——模型容量被大幅削弱,生成图像的细节和一致性往往崩得一塌糊涂。研究人员在论文中指出,“修剪 50% 的权重会移除关键的模型容量,降低生成质量”,这确实是个老难题。

不过,RT-Lynx 团队在探索中真的找到了一个关键突破口。他们的研究发现,DiT 的激活值其实天生就具备稀疏特性,并且对 N: 结构的剪枝表现出极强的鲁棒性。这意味着,与其和权重死磕,不如换个思路,从激活值入手。这样一来,近半的计算量削减就不再是遥不可及的目标,而是触手可及的工程优化。

这项工作的核心价值在于,它把稀疏化的矛头指向了正确的方向。此前业界对半结构化稀疏性的潜力虽有耳闻,但一直苦于在扩散模型上没有找到合适的落点。RT-Lynx 通过重新审视 GEMM 运算中的稀疏性布局,算是给出了一个挺合理的解法。 它没有依赖量化或蒸馏这类常规手段,而是独辟蹊径,证明了稀疏性本身就能在保持生成能力的同时,把 FLOPs 降下来。

当然,任何新技术从论文走向大规模部署都还有一段路要走。但 RT-Lynx 至少指出了一个事实:扩散模型的推理成本并非铁板一块,激活值中隐藏的稀疏性,完全值得被更深地挖掘。这无疑为后续的模型轻量化设计注入了一股新的思路。

热门栏目