CryoGEN-II:最优传输的分布匹配
把"逐张最优"换成"整体分布对齐" —— 用最优传输稳住训练、匹配真实结构的整体分布
CryoGEN-II 紧接 CryoGEN-I 而来。CryoGEN-I 对每张断层图给出一个点估计 ,但它的对抗式 min–max 训练易不稳、易模式坍缩。CryoGEN-II 保留”无真值、靠 proxy 监督”的同一根基,却把目标从”逐张求最优”换成”让生成重构的整体分布对齐真实结构的分布”,并改用最优传输而非对抗博弈来达成。它仍然只对每个观测输出一个确定性重构 —— 真正把答案变成”一族重构”、刻画缺失楔形留下的不确定性,是 CryoWGEN 的事。
CryoGEN-I 给每张图配一个”最佳答案”,但它学的是一个密度比(判别器区分真/假),两个分布在训练初期几乎不重叠时,这个比值要么饱和、要么给出爆炸或消失的梯度 —— 这就是 min–max 训练不稳、易模式坍缩的根源。
CryoGEN-II 换一个问法:与其逐张较劲,不如要求生成出来的所有重构,作为一个整体分布,与真实结构的分布一致。两个分布即便起初不重叠,“把一堆质量搬到另一堆要走多远”这件事仍然是平滑、处处可微的 —— 这正是最优传输能稳住训练的关键。
一维平方代价下,最优耦合就是把源点与目标点各自排序后按序配对(单调匹配)。任意交叉的配对都会严格增大总代价,因此连线从不交叉;拖动偏移时质量整体平移,总代价随之平滑变化。
从对抗博弈到最优传输
CryoGEN-II 不再训练一个判别器与生成器博弈,而是直接最小化把生成分布 搬到数据分布 的传输代价:
逐项来看: 是真实观测的分布(大量真实拍到的断层图), 是网络对各观测输出的重构在重构空间 里聚合而成的分布; 是一个耦合(运输方案),它规定有多少质量从 搬到 , 是所有以 、 为边缘的耦合之集; 在所有这样的方案中取代价最小者。代价 取平方 距离。注意 与 活在不同空间、不能直接比较 —— 代价先用与 CryoGEN 同一个缺失楔形退化算子 把干净重构 打回观测空间,再与 比平方距离 。
直接对耦合 求 是一个线性规划,规模随样本数爆炸、无法直接放进训练循环。最优传输的半对偶形式把它转写成对单个势函数 的优化:
其中 是 关于代价 的 c-变换。关键在于:这里只有一个被优化的函数 ,没有 CryoGEN-I 式生成器与判别器的 min–max 对抗,因而训练显著更稳。这个单势函数形式还天然兼容编码器–解码器结构 —— 它正是 Wasserstein 自编码器(WAE)的目标:把数据编码进隐空间、解码还原,再要求隐空间里的聚合后验与先验之间的传输代价最小。CryoGEN-II 借用的就是这条”最优传输 → 自编码器”的骨架。
全局分布匹配
CryoGEN-I 与 CryoGEN-II 的真正分水岭,在于”对齐”发生在哪一层。CryoGEN-I 是逐张的:对每个 单独求一个使 加能量先验最小的 ,每张图各自为政。CryoGEN-II 额外强制全局约束 —— 把所有观测上的重构聚合起来,要求
逐项来看: 是网络在给定观测 时输出的重构, 是观测的边缘分布,对 积分即把所有观测上的重构汇总成一个聚合分布; 是干净结构的先验。约束的含义是:网络生成的全体重构,在统计意义上要与真实结构的整体分布一致 —— 而不只是每张图各自对上自己的后验。
逐张保真,保证的是”每一张图都对得上自己的观测”;全局分布匹配,保证的是”整批重构合起来,像真实数据集该有的样子”。后者多出来的约束,正好压住那些单看每张图都说得通、合起来却与真实结构分布相悖的伪影 —— 因为这类伪影会让聚合分布 偏离先验 ,从而抬高传输代价。
这里 本身不可得 —— 没有任何真值重构。监督仍然完全来自真实观测 :把生成体经 退化后的分布搬去贴合 ,就隐式地让聚合重构贴近 。这正是 proxy 思想在分布层面的体现。整个过程是纯优化 —— 不需要 Langevin 或 Monte-Carlo 采样。
效果与局限
把目标从逐张最优升级为全局分布匹配,CryoGEN-II 收获了两点:其一,单势函数的最优传输目标取代了对抗 min–max,训练不再模式坍缩、显著更稳;其二,重构在聚合统计上与真实结构分布一致,伪影更少、更可信。它给出的是一个稳定、真实的点估计 —— 整条 CryoGEN 谱系里最可靠的那一条曲线。
但它的局限也正源于”点估计”本身:对每个观测,CryoGEN-II 仍只返回一个确定性重构。而缺失楔形抹掉的傅里叶信息,原则上对应着不止一个合理的 —— 数据本身就留有不确定性。一条确定性的曲线无法表达”哪些区域更可信、哪些区域是猜的”。要把单一答案升级为一族重构、用一个玻尔兹曼后验刻画这份不确定性,需要换一套熵变分的框架 —— 这正是 CryoWGEN 的出发点。
论文:CryoGEN-II 发表于 CVPR 2026 Workshops(VISION);其前身 CryoGEN-I 发表于 ICLR 2025。