成像与数据采集
从制样、急冻,到镜筒里的电子光路与探测器,再到一张张(或一套套倾转序列)数据怎么拍出来。
要拿到一套能做重构的数据,大致走三步:制样、急冻、上机拍。 每一步都受同一个约束牵制 —— 电子既是照明,也是损伤源,剂量花得少之又少。
把整个流程想成”在限定预算里拍一张极弱光的照片”。这份预算就是样品在被打烂之前能承受的电子总数,单位是每平方埃多少个电子(e⁻/Ų)。你不能像晒胶片那样想拍多亮拍多亮:电子打上去既贡献信号,也在断化学键。因此采集的每一个决定 —— 拍一张还是拍一套、欠焦多少、分成几帧 —— 本质上都是在问”这点预算怎么花最值”。后面所有的噪声、模糊、缺角,根子都在这条预算线上。
一、制样与玻璃化
样品滴在一张布满微孔的载网(grid)上,用滤纸吸掉多余液体,留下一层几十到上百纳米的薄膜;随即把它插入液态乙烷中毫秒级急冻。乙烷导热快、且不像液氮那样在样品周围形成隔热的气膜,于是水来不及结晶就被冻成玻璃态。薄、且无冰晶,是后续一切的前提。
为什么薄这么关键?电子穿过含水冰层会被多次散射,冰越厚,单次散射的”干净”信号占比越低,图像越糊。所以理想的膜往往只有几十纳米 —— 一两层蛋白复合物的厚度。太厚则信号被散射淹没,太薄则颗粒可能被挤变形、或暴露在气液界面被破坏。这层薄膜的厚度均匀性,直接决定了一张载网上有多少区域”能用”。关于玻璃化为何能在近原生状态下锁住结构,以及晶冰为何是大敌,见冷冻电镜与玻璃化一节。
二、镜筒里的电子光路
一台透射电镜从上到下是一条电子光路:
- 电子枪(多为场发射枪 FEG)发出相干电子束;
- 聚光镜把束流整形、照到样品上;
- 样品台在液氮温度下托住载网,并能精确倾转;
- 物镜成像,其散焦与像差决定了对比度传递(CTF);
- 投影镜把像放大投到探测器;
- **直接电子探测器(DED)**逐个电子计数,并以「电影」方式分帧记录。
这条光路和光学显微镜是同一套思路 —— 照明、聚焦、成像、放大、记录 —— 只是把光换成电子、把玻璃透镜换成磁透镜。换成电子的理由只有一个:分辨率。电子的德布罗意波长远短于可见光,几百千伏加速电压下波长在皮米量级,原理上能分辨到原子尺度。代价是电子必须走在高真空里(否则被空气分子散射),样品也因此必须先冻成能扛真空、扛辐照的玻璃态冰。
值得单独说的是直接电子探测器(DED)。它取代了早年的 CCD/胶片,关键差别在于它能逐个电子计数,并把一次曝光记录成一段几十帧的”电影”。这两点 —— 计数模式带来的极低读出噪声、分帧带来的事后运动校正能力 —— 是过去十年 Cryo-EM 分辨率从”看个轮廓”跨到”看到侧链”的硬件支点。下一节的低剂量与分帧,正是建立在它之上。
三、低剂量成像与分帧
为把辐照损伤压到最低,全程低剂量:先在邻近区域对焦,再到目标区曝一次极弱的光。曝光被切成几十帧的「电影」——剂量分帧——这样可以事后做运动校正,把束流引起的样品漂移对齐叠加回来。由于对比度需要,图像通常欠焦拍摄,这会引入需要在重构里反卷积的 CTF。
把数字摆出来看更直观。一次单颗粒曝光的总剂量量级在几十 e⁻/Ų(具体取决于目标分辨率),若切成 40 帧,每帧就只摊到约 1 e⁻/Ų —— 单帧几乎全是噪声,肉眼根本看不出颗粒。但这正是分帧的用意:先对齐、再叠加。 样品在束流照射的头几个电子里漂移最剧烈(电荷累积、支撑膜松弛),如果直接长曝一张,这段漂移会把图像抹糊;拆成帧后,可以逐帧测出漂移轨迹、把它们对齐再求和,等效于”先稳住相机再按快门”。
为什么是欠焦,而不是精确对焦?薄的玻璃态生物样品几乎不吸收电子,主要靠改变电子波的相位来携带信息,这种相位差在精确对焦处几乎不转成可见的明暗对比。刻意欠焦相当于引入一段离焦相移,把相位信息部分搬到能看见的振幅对比上来 —— 代价是这段相移随空间频率振荡,在某些频率甚至翻转衬度(黑白颠倒),这就是 CTF 的来历。欠焦越多,低频对比越强、越好对中和挑颗粒,但 CTF 振荡越密、高频越早被压制。所以采集时常刻意错开各张的欠焦量:一张的 CTF 零点(信息缺口)由另一张来填补,合到一起才不丢频率。重构必须先估出每张的离焦、再做反卷积把这套调制解开。
四、单张 vs 倾转序列
- 单颗粒:在样品各处拍成千上万张显微图,每张里有许多朝向各异的同种颗粒。
- 断层成像(Cryo-ET):盯住同一块区域,按一套倾转方案(如剂量对称方案,从 0° 向两侧交替倾转)拍一整套倾转序列,每个角度一张。受样品台与样品厚度所限,倾转通常止步于约 ±60° —— 这就是缺失楔形的由来。
这两条路在剂量怎么花上是镜像的。单颗粒把整份预算押在一个角度上拍一张,靠”成千上万个同种分子、各种朝向”在计算上凑齐三维信息,每个分子只贡献一个视角,但拷贝数巨大,平均之后信噪比很高。断层成像则反过来:只有一个实体(一段细胞、一个细胞器),没有可平均的拷贝,只能让它在样品台上转起来、从几十个角度各拍一张,把同一份预算摊薄到整条序列上。设总剂量为 、共拍 张,则每个角度大约只分到 ,于是每张投影都极其嘈杂。这就是为什么断层数据的单张信噪比远低于单颗粒 —— 它用”少而独特的视角”换”近原生、原位的完整场景”。
而且断层成像还多欠一笔账:样品台倾到约 ±60° 就转不动了(再倾,电子穿过冰板的路径按 拉长,样品厚到电子穿不透),高于这个角度的视角根本没拍到。傅里叶空间里这缺的一块呈楔形,就是缺失楔形,它让重构在某些方向天生看不清。单颗粒因为颗粒朝向随机、能在统计上铺满所有角度,原则上没有这个问题。
数据拍完,并不等于结构到手:每张图都噪声极大、被 CTF 调制,断层序列还缺了一整块角度。这些根本限制,是下一页(根本限制)的主题,也是本站后续所有方法要对付的对象。
从原始数据到三维体:后面发生什么
把数据交给计算之前,还有几步把”一堆带噪声、各自漂移、各自离焦的图”整理成可重构的输入。第一步是对齐:倾转过程中样品台有机械移位、样品本身有漂移和形变,各角度的图从不完美套准,需要借助图中的基准点(常用金颗粒)或图像互相关把它们配准到同一坐标系,这是倾转序列对齐的工作。第二步是逐图 CTF 估计:一条序列没有单一离焦值,倾斜后同一张图内不同位置沿束流方向高度不同、焦面随之变化,所以离焦要逐倾角、甚至逐条带地估出来。对齐并校正 CTF 之后,这些投影才被送进重构,由反投影或迭代拟合合成一个三维体。
也正是因为输入端就带着”低信噪比 + CTF 调制 + 缺失楔形”这三重残缺,重构从来不是简单的几何反演,而是一个欠定的反问题 —— 同样的投影可以对应多种三维解释。本站的统计与学习型方法(见 CryoGEN 等方法)正是为补上这份残缺而生:用先验和数据约束,从拍到的不完整证据里推回最可信的结构。