RT-Lynx用半结构化稀疏性削减扩散模型近半FLOPs

时间：2026-05-29 20:51:01 编辑：袖梨来源：一聚教程网

arXiv:2605.26632v1 公布了一项针对扩散模型推理瓶颈的研究，研究人员提出名为 RT-Lynx 的方法，通过半结构化稀疏性成功削减模型近半 FLOPs。该工作直接切入 Diffusion Transformers (DiT) 在图像生成中计算成本高昂的痛点，试图在不显著牺牲生成质量的前提下，将计算效率推上一个台阶。

为什么现有稀疏化方法在扩散模型上总是碰壁？ 以往的工作大多聚焦于权重稀疏化，简单粗暴地将 50% 的权重砍掉。这种做法的弊端很明显——模型容量被大幅削弱，生成图像的细节和一致性往往崩得一塌糊涂。研究人员在论文中指出，“修剪 50% 的权重会移除关键的模型容量，降低生成质量”，这确实是个老难题。

不过，RT-Lynx 团队在探索中真的找到了一个关键突破口。他们的研究发现，DiT 的激活值其实天生就具备稀疏特性，并且对 N: 结构的剪枝表现出极强的鲁棒性。这意味着，与其和权重死磕，不如换个思路，从激活值入手。这样一来，近半的计算量削减就不再是遥不可及的目标，而是触手可及的工程优化。

这项工作的核心价值在于，它把稀疏化的矛头指向了正确的方向。此前业界对半结构化稀疏性的潜力虽有耳闻，但一直苦于在扩散模型上没有找到合适的落点。RT-Lynx 通过重新审视 GEMM 运算中的稀疏性布局，算是给出了一个挺合理的解法。 它没有依赖量化或蒸馏这类常规手段，而是独辟蹊径，证明了稀疏性本身就能在保持生成能力的同时，把 FLOPs 降下来。

当然，任何新技术从论文走向大规模部署都还有一段路要走。但 RT-Lynx 至少指出了一个事实：扩散模型的推理成本并非铁板一块，激活值中隐藏的稀疏性，完全值得被更深地挖掘。这无疑为后续的模型轻量化设计注入了一股新的思路。

推荐专题

最新下载

热门教程

RT-Lynx用半结构化稀疏性削减扩散模型近半FLOPs

相关文章

热门栏目

php教程

asp.net教程

手机开发

css教程

网页制作

办公数码

jsp教程