一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

SEGS 提出结构能量引导采样解决文本到3D生成的视角不一致问题

时间:2026-06-01 17:42:01 编辑:袖梨 来源:一聚教程网

SEGS 提出结构能量引导采样,这一训练免费且即插即用的框架,直接针对文本到 3D 生成中因视角不一致引发的 Janus 问题,给出了解决方案。方法的核心在于识别出 2D 扩散先验中的视角偏差是主因,并通过构建 U-Net 特征 PCA 子空间内的结构能量,将其梯度注入去噪过程。

视角偏差才是罪魁祸首?

现有基于扩散模型的文本到 3D 生成技术,常常生成前后矛盾的多面几何体,比如一个物体在正面和侧面看起来完全不同。研究团队发现,这并非模型能力不足,而是 2D 扩散先验本身在训练数据中自带的方向偏好。SEGS 相当于给生成过程加了一个「校正器」,强迫它从多个视角看物体时必须保持一致,效果真的挺明显。

无需重训,即插即用

SEGS 框架最大的亮点在于它不需要任何额外的训练。咱们可以直接把它嵌入到现有的 SDS(得分蒸馏采样)或 VSD(变分得分蒸馏)流程中,只需要在反向去噪步骤里注入结构能量的梯度就行。这意味着开发者不用推翻之前的代码,只需简单调用,就能大幅提升多视角一致性,成本几乎为零。

技术实现其实挺巧妙

简单来说,SEGS 在 U-Net 特征的主成分分析(PCA)子空间里定义了一个结构能量函数。这个函数会惩罚那些在不同视角下看起来不一致的特征模式,相当于给扩散过程一个实时的「几何约束」。实验证明,即使面对复杂的文本提示,SEGS 也能有效消除视角偏差,生成的 3D 模型从各个角度观看都不会出现奇怪的拉伸或破损,何来丑角似的侧脸呢?

行业痛点的一次精准打击

文本到 3D 生成在游戏、影视、数字人等领域需求巨大,但生成结果总在某一角度露馅,这成为落地的主要障碍。SEGS 的出现意味着困扰行业许久的 Janus 问题有了一个轻量级的解决方案。它不依赖额外数据,不改动模型结构,真正做到了即插即用——这对工业界来说,无疑是一个可喜的进展。

热门栏目