根本限制

剂量与分辨率的取舍、样品厚度、以及断层成像独有的缺失楔形 —— Cryo-EM 绕不开的几道坎。

Cryo-EM 不是分辨率不够高,而是几道物理的坎绕不过去。看清它们,才看得懂本站后面所有方法到底在跟什么较劲。

直觉

把这一页的三道坎记成一句话:你能往样品上倾倒的电子是有限的,样品本身是会糊的,而你又转不满一圈。 第一道限制了每张图能有多清楚,第二道限制了样品能有多厚,第三道限制了你能从几个方向去看它。三者叠在一起,意味着到手的永远是一组又少、又噪、又缺角的观测 —— 而不是结构本身。后面所有方法,本质上都在跟这三个字较劲:少、噪、缺。

一、剂量预算:越想看清,越打得坏

电子在成像的同时也在破坏样品:每一个穿过样品的电子都在打断化学键、产生自由基。而高分辨的信息最先死掉 —— 精细结构(侧链、二级结构、晶格条纹)对辐照最敏感,往往在累积剂量还很低时就被抹平了,而粗大的轮廓能撑得更久。于是有了一个残酷的取舍:

具体到数量级:单张冷冻投影通常只用每平方埃几个电子的剂量,整条倾转序列加起来也常控制在几十 e/A˚2e^-/\text{Å}^2 这个量级以内(再多,高分辨信息就先于成像被破坏了)。在这么稀的电子下,一个像素接收到的电子数本身就是一个小的随机数,服从泊松统计:若期望收到 NN 个电子,涨落约为 N\sqrt{N},相对噪声约 1/N1/\sqrt{N}NN 小,相对噪声就大 —— 这是物理上的硬下限,跟相机好坏无关。

这就是为什么单张冷冻图几乎”全是噪声”:肉眼几乎看不出里面有任何结构。

深入

把”剂量分摊”想清楚,就明白单颗粒和断层成像为什么命运不同。给定一个总剂量预算 DD(受辐照损伤封顶),你有两种花法:

  • 单颗粒:把 DD 全压在一张图上,得到信噪比还过得去的二维投影;但每个分子只拍到一个朝向。靠在样品里找到成千上万个同种分子的拷贝,把它们对齐后平均,信噪比按 n\sqrt{n} 提升(nn 是拷贝数)—— 平均一万个拷贝,等效信噪比提升约 100 倍。代价是只能解可大量复制、且都长一样的结构。
  • 断层成像(Cryo-ET):要从同一个独一无二的对象(比如一段细胞内的膜)取多个倾角,于是必须把同一份预算 DD 摊到几十张图上。每张分到的剂量是单颗粒的几十分之一,单张信噪比低到接近不可见,而且这个对象在世界上只此一份,没有拷贝可平均。

所以断层成像天生就在更恶劣的信噪比下工作,又没有”平均拷贝”这条退路。把信号从这种噪声里捞回来,只能靠对结构的统计建模:用信噪比的语言量化还剩多少信息,再用先验把它补足。

单颗粒靠平均成千上万个拷贝把信噪比拉起来;断层成像没有那么多拷贝,只能在低信噪比下硬扛 —— 这正是统计建模能帮上忙的地方。也正因为剂量要分摊,每个倾角的那次曝光还会被拆成几十帧的”电影”,事后做运动校正再加回来(剂量分帧)—— 用一点点后期处理,把已经很稀的电子尽量都利用上。

二、样品必须够薄

电子穿透力有限:样品越厚,一个电子在穿过的路上越可能被散射不止一次(多重散射)。单次散射携带的相位信息是我们想要的;多重散射则把这些信息搅在一起,图像越来越糊,对比也变差。这把可成像的厚度限制在大约几百纳米这个量级。

直觉

把电子束想成穿过毛玻璃的光。玻璃薄,能看清后面的字(单次散射,信息干净);玻璃厚,只剩一片亮(多次散射,信息糊成一团)。冰层就是这块玻璃 —— 太厚,再好的电镜也救不回来。

很多有意思的对象(一整个真核细胞)本身就有好几微米厚,远超这个上限。要做原位断层成像(在细胞里直接看分子机器),通常先用**聚焦离子束(FIB)**像刨子一样,从冻好的细胞上削出一片大约 100–200 纳米厚的薄层(lamella),再拿去成像。这一步把”样品太厚”从一道死路变成一道工序,但代价是只能看到被削出来的那一薄片。

三、断层成像独有:缺失楔形

关键

样品台没法转满 ±90°:转到太斜时,电子要穿过的有效厚度按 1/cosθ1/\cos\theta 急剧变大(6060^\circ 时已是两倍、信号大幅变差),机械上样品架也会挡住光路。于是倾转通常止步于约 ±60°,傅里叶空间里留下一对取不到的楔形 —— 缺失楔形。它把重构沿一个方向拉长、抹平。

把这件事量化:能采到的角度只覆盖 ±θmax\pm\theta_{\max},剩下的就是缺口。缺失楔形的半张角是

α=90θmax,\alpha = 90^\circ - \theta_{\max},

其中 θmax\theta_{\max} 是实际能转到的最大倾角,α\alpha 是傅里叶空间里每一侧没被采到的那块楔形的半张角。当 θmax=60\theta_{\max}=60^\circα=30\alpha=30^\circ —— 也就是说约 1/3 的方向从来没有被测量过。这块缺口为什么恰好是一对楔形、为什么沿 Z 轴把结构拉长,由中心切片定理决定,详见缺失楔形那一页。

关键在于:缺失楔形不是噪声,而是一整块从未被测到的信息。噪声多拍几张、多平均就能压下去;缺失的数据再怎么降噪、滤波都变不出来 —— 它根本就不在数据里。要填它,只能引入关于”什么样的结构才合理”的先验(比如:膜是连续光滑的、密度非负、相似的分子机器应当长得相似),把它当成一个反问题来解。这也是本站后面所有重构方法的共同出发点。

还有一道:CTF 调制

即使不谈缺失楔形,电镜给你的也不是结构的”原样投影”。为了拿到衬度,成像通常欠焦,这会引入一个衬度传递函数(CTF):它在傅里叶空间里像一组振荡的环,把某些空间频率压低、某些直接翻转符号、还在一圈圈零点处把对应频率彻底抹掉。换句话说,观测是真实信号被这条 CTF 调制(再叠上噪声)之后的产物。重构时必须把它反卷积回来,否则结构会带着虚假的条纹和反转的衬度。CTF 的形状和零点位置,见衬度传递函数那一页。

把限制变成问题

把这几道坎收拢起来 —— 低信噪比、CTF 调制、缺失楔形 —— 它们本质上是同一句话:从残缺、含噪、被调制过的观测,反推那个唯一的干净结构。 用公式写,观测 yy 与未知结构 xx 的关系大致是

y=CCTF  W缺楔投影x  +  n噪声,y = \underbrace{C}_{\text{CTF}}\;\underbrace{W}_{\text{缺楔投影}}\,x \;+\; \underbrace{n}_{\text{噪声}},

其中 xx 是我们想要的三维密度,WW 是”只从 ±θmax\pm\theta_{\max} 这些角度做投影”这个不完整的测量算子,CC 是 CTF 调制,nn 是低剂量带来的噪声。WW 不可逆(缺了一块)、nn 又很大,所以直接求逆是病态的:满足这个方程的 xx 有无穷多个。

要在无穷多个解里挑出合理的那个,就得加上先验 p(x)p(x),于是问题变成一个贝叶斯反问题:在 p(xy)p(yx)p(x)p(x\mid y)\propto p(y\mid x)\,p(x) 下推断 xx。本站后面用信号处理(CTF、滤波、采样)、概率与统计MAP 与 EM、贝叶斯推断)、最优传输等工具把它一步步拆开,最终落到我们自己的 Cryo-ET 重构方法上 —— 它们的区别,正是在”如何回答这个病态反问题”上:是给一个点估计(CryoGEN-I),一个稳定的单一答案(CryoGEN-II),还是干脆给出一族后验样本(CryoWGEN)。

← 电子断层成像