成像与数据采集

从制样、急冻，到镜筒里的电子光路与探测器，再到一张张（或一套套倾转序列）数据怎么拍出来。

要拿到一套能做重构的数据，大致走三步：制样、急冻、上机拍。 每一步都受同一个约束牵制 —— 电子既是照明，也是损伤源，剂量花得少之又少。

直觉

把整个流程想成”在限定预算里拍一张极弱光的照片”。这份预算就是样品在被打烂之前能承受的电子总数，单位是每平方埃多少个电子（e⁻/Å²）。你不能像晒胶片那样想拍多亮拍多亮：电子打上去既贡献信号，也在断化学键。因此采集的每一个决定 —— 拍一张还是拍一套、欠焦多少、分成几帧 —— 本质上都是在问”这点预算怎么花最值”。后面所有的噪声、模糊、缺角，根子都在这条预算线上。

一、制样与玻璃化

样品滴在一张布满微孔的载网（grid）上，用滤纸吸掉多余液体，留下一层几十到上百纳米的薄膜；随即把它插入液态乙烷中毫秒级急冻。乙烷导热快、且不像液氮那样在样品周围形成隔热的气膜，于是水来不及结晶就被冻成玻璃态。薄、且无冰晶，是后续一切的前提。

为什么薄这么关键？电子穿过含水冰层会被多次散射，冰越厚，单次散射的”干净”信号占比越低，图像越糊。所以理想的膜往往只有几十纳米 —— 一两层蛋白复合物的厚度。太厚则信号被散射淹没，太薄则颗粒可能被挤变形、或暴露在气液界面被破坏。这层薄膜的厚度均匀性，直接决定了一张载网上有多少区域”能用”。关于玻璃化为何能在近原生状态下锁住结构，以及晶冰为何是大敌，见冷冻电镜与玻璃化一节。

二、镜筒里的电子光路

深入

一台透射电镜从上到下是一条电子光路：

电子枪（多为场发射枪 FEG）发出相干电子束；
聚光镜把束流整形、照到样品上；
样品台在液氮温度下托住载网，并能精确倾转；
物镜成像，其散焦与像差决定了对比度传递（CTF）；
投影镜把像放大投到探测器；
**直接电子探测器（DED）**逐个电子计数，并以「电影」方式分帧记录。

这条光路和光学显微镜是同一套思路 —— 照明、聚焦、成像、放大、记录 —— 只是把光换成电子、把玻璃透镜换成磁透镜。换成电子的理由只有一个：分辨率。电子的德布罗意波长远短于可见光，几百千伏加速电压下波长在皮米量级，原理上能分辨到原子尺度。代价是电子必须走在高真空里（否则被空气分子散射），样品也因此必须先冻成能扛真空、扛辐照的玻璃态冰。

值得单独说的是直接电子探测器（DED）。它取代了早年的 CCD/胶片，关键差别在于它能逐个电子计数，并把一次曝光记录成一段几十帧的”电影”。这两点 —— 计数模式带来的极低读出噪声、分帧带来的事后运动校正能力 —— 是过去十年 Cryo-EM 分辨率从”看个轮廓”跨到”看到侧链”的硬件支点。下一节的低剂量与分帧，正是建立在它之上。

三、低剂量成像与分帧

为把辐照损伤压到最低，全程低剂量：先在邻近区域对焦，再到目标区曝一次极弱的光。曝光被切成几十帧的「电影」——剂量分帧——这样可以事后做运动校正，把束流引起的样品漂移对齐叠加回来。由于对比度需要，图像通常欠焦拍摄，这会引入需要在重构里反卷积的 CTF。

把数字摆出来看更直观。一次单颗粒曝光的总剂量量级在几十 e⁻/Å²（具体取决于目标分辨率），若切成 40 帧，每帧就只摊到约 1 e⁻/Å² —— 单帧几乎全是噪声，肉眼根本看不出颗粒。但这正是分帧的用意：先对齐、再叠加。 样品在束流照射的头几个电子里漂移最剧烈（电荷累积、支撑膜松弛），如果直接长曝一张，这段漂移会把图像抹糊；拆成帧后，可以逐帧测出漂移轨迹、把它们对齐再求和，等效于”先稳住相机再按快门”。

深入

为什么是欠焦，而不是精确对焦？薄的玻璃态生物样品几乎不吸收电子，主要靠改变电子波的相位来携带信息，这种相位差在精确对焦处几乎不转成可见的明暗对比。刻意欠焦相当于引入一段离焦相移，把相位信息部分搬到能看见的振幅对比上来 —— 代价是这段相移随空间频率振荡，在某些频率甚至翻转衬度（黑白颠倒），这就是 CTF 的来历。欠焦越多，低频对比越强、越好对中和挑颗粒，但 CTF 振荡越密、高频越早被压制。所以采集时常刻意错开各张的欠焦量：一张的 CTF 零点（信息缺口）由另一张来填补，合到一起才不丢频率。重构必须先估出每张的离焦、再做反卷积把这套调制解开。

四、单张 vs 倾转序列

单颗粒：在样品各处拍成千上万张显微图，每张里有许多朝向各异的同种颗粒。
断层成像（Cryo-ET）：盯住同一块区域，按一套倾转方案（如剂量对称方案，从 0° 向两侧交替倾转）拍一整套倾转序列，每个角度一张。受样品台与样品厚度所限，倾转通常止步于约 ±60° —— 这就是缺失楔形的由来。

这两条路在剂量怎么花上是镜像的。单颗粒把整份预算押在一个角度上拍一张，靠”成千上万个同种分子、各种朝向”在计算上凑齐三维信息，每个分子只贡献一个视角，但拷贝数巨大，平均之后信噪比很高。断层成像则反过来：只有一个实体（一段细胞、一个细胞器），没有可平均的拷贝，只能让它在样品台上转起来、从几十个角度各拍一张，把同一份预算摊薄到整条序列上。设总剂量为 $D$ 、共拍 $N$ 张，则每个角度大约只分到 $D/N$ ，于是每张投影都极其嘈杂。这就是为什么断层数据的单张信噪比远低于单颗粒 —— 它用”少而独特的视角”换”近原生、原位的完整场景”。

而且断层成像还多欠一笔账：样品台倾到约 ±60° 就转不动了（再倾，电子穿过冰板的路径按 $1/\cos\theta$ 拉长，样品厚到电子穿不透），高于这个角度的视角根本没拍到。傅里叶空间里这缺的一块呈楔形，就是缺失楔形，它让重构在某些方向天生看不清。单颗粒因为颗粒朝向随机、能在统计上铺满所有角度，原则上没有这个问题。

数据拍完，并不等于结构到手：每张图都噪声极大、被 CTF 调制，断层序列还缺了一整块角度。这些根本限制，是下一页（根本限制）的主题，也是本站后续所有方法要对付的对象。

从原始数据到三维体：后面发生什么

把数据交给计算之前，还有几步把”一堆带噪声、各自漂移、各自离焦的图”整理成可重构的输入。第一步是对齐：倾转过程中样品台有机械移位、样品本身有漂移和形变，各角度的图从不完美套准，需要借助图中的基准点（常用金颗粒）或图像互相关把它们配准到同一坐标系，这是倾转序列对齐的工作。第二步是逐图 CTF 估计：一条序列没有单一离焦值，倾斜后同一张图内不同位置沿束流方向高度不同、焦面随之变化，所以离焦要逐倾角、甚至逐条带地估出来。对齐并校正 CTF 之后，这些投影才被送进重构，由反投影或迭代拟合合成一个三维体。

也正是因为输入端就带着”低信噪比 + CTF 调制 + 缺失楔形”这三重残缺，重构从来不是简单的几何反演，而是一个欠定的反问题 —— 同样的投影可以对应多种三维解释。本站的统计与学习型方法（见 CryoGEN 等方法）正是为补上这份残缺而生：用先验和数据约束，从拍到的不完整证据里推回最可信的结构。

← 电子断层成像