原位结构生物学
Cryo-ET 直接在细胞内、于其原生细胞环境中解析大分子结构。
原位结构生物学 (in situ structural biology) 在大分子真正工作的地方——细胞内部——研究它们,而非提纯之后。电子断层成像是其核心工具:一个玻璃化的细胞,或从中减薄出的一片薄片,被采集为倾转序列并重构成三维断层图,把复合物连同其原生环境一并捕获——嵌在膜中、与伙伴结合、按活细胞留下的样子排布。
跨尺度缩放 —— 从完整细胞到断层重构里的分子:
原位冷冻电子断层跨越三个尺度:先把整个细胞玻璃化,再用聚焦离子束(FIB)切出约 200 nm 的薄片,最后在断层重构里分辨出细胞内原本位置上的大分子——无需把它们提纯出来。
由整个细胞到可解读的断层图,需要跨越数个数量级的尺度。一个真核细胞直径约 10–20 微米,而我们想看清的核糖体直径约 25 纳米——相差近三个数量级。完整细胞对电子束而言过厚,因此采集前先用聚焦离子束 (cryo-FIB) 在玻璃化状态下削去上下方的大部分材料,仅留下一片厚约一两百纳米的薄片;目标复合物的内部细节则在纳米尺度上显现。该尺度递进——细胞、薄片、断层图——是原位工作流程的骨架。
这种原生环境正是其决定性优势。提纯会剥离相互作用伙伴、膜环境与复合物的空间组织;原位成像把这一切都保留下来。该方法催生了可视蛋白质组学 (visual proteomics)——在单个细胞体积内绘制众多分子物种的身份与位置——以及有时被称为分子社会学 (molecular sociology) 的研究,即分子在空间中如何分布、取向并彼此关联。除单个结构外,断层图还揭示细胞质的拥挤 (crowding):大分子以提纯样品永远无法重现的浓度堆挤在一起。
提纯的结构是在影棚里拍的肖像。原位结构则是同一分子在它所生活的人群中被拍下——更不摆姿、更嘈杂,却显示出它紧挨着谁、坐落何处,这是任何影棚肖像都承载不了的信息。
代价落在信号上。细胞远比一薄层孤立颗粒更厚、更稠密,即便减薄过的薄片也散射得更多,每个目标背后衬着的都是其他分子构成的稠密背景。信噪比明显低于提纯样品,缺失楔形也依旧扭曲着重构。所以,要辨识并解析出一个复合物,得依靠一整套下游流程:用分割勾画细胞架构、用颗粒挑选定位每一份拷贝、再用子断层平均把众多实例合并起来,才能达到高分辨率。
同样的低信噪比、拥挤条件也是学习型复原的动机。CryoGEN 与 CryoWGEN 等学习型缺失楔形修复方法,旨在让原位断层图更可解读,支撑原位结构生物学所依赖的挑选、分割与平均。
定位目标:CLEM 与 FIB 减薄
在一整个冻细胞里,目标复合物往往只占其体积极小的一隅,又没有明显的地标可循,所以光是定位本身就是一道难题。光电关联显微术 (CLEM) 的思路是先用冷冻荧光给细胞成像:标记过的结构会在已知位置发光,再把这张荧光图谱与电镜视图配准,减薄和成像就能瞄准正确的区域。薄薄片 (lamella) 本身由 cryo-FIB 减薄产生:聚焦的镓离子束把选定平面上下的材料逐层烧蚀掉,直到只剩一片一两百纳米厚的板——薄到足以让电子束穿过,却仍封存在玻璃态冰中。整个减薄过程都可以保持关联,以免不小心把荧光目标也切掉。
薄片的厚度不是随手定的,它把两种相互拉扯的诉求卡在了中间。要的信号越多,就越想留下更厚的板,因为更厚意味着视野里有更多目标分子;但电子在样品里会发生非弹性散射,路径越长,被散射出成像光路的电子就越多,背景噪声也越涨。
把薄片的取舍量化,关键尺度是非弹性平均自由程 ——电子在被非弹性散射一次之前平均走过的距离。在 300 kV、玻璃态冰中, 约为 300–400 纳米。透过一片厚 的薄片、且只经历零次或一次散射(即对成像有用)的电子,其占比大致按
衰减。这里 是入射电子数, 是仍落在有用能量窗口内的电子数, 是薄片厚度, 是非弹性平均自由程。
取 纳米: 纳米时,约 的电子可用; 纳米时降到约 ;到 纳米则只剩约 。这条指数曲线正是薄片普遍落在 100–200 纳米的原因——更厚的板里几乎每个电子都被多次散射,徒增模糊却不添信号。
这一约束还和倾转序列叠加:在倾角 下,电子穿过薄片的有效路径长按 增长,到 已是两倍。所以高倾角图像不仅受缺失楔形几何所限,本身也最厚、最噪——这正是断层图各向异性的双重根源。
拥挤为何令复原至关重要
细胞内大分子的浓度可高达每毫升数百毫克,因此每个目标衬着的是稠密、有结构的背景,而不是空荡荡的缓冲液。这层背景本身就是其他分子的信号,并非单纯的噪声,没法像一薄层冰那样直接减掉。再叠上厚样品的剂量限制和缺失楔形,结果就是单个复合物在断层图里几乎肉眼难辨。
之所以非得求平均不可,背后是个简单的数字。原位断层图里单个颗粒的信噪比可能低到 0.1 量级——单看一份拷贝,分子的形状淹没在噪声里。把 个对齐的相同拷贝叠加,相干的信号线性累加,而不相干的噪声只按 累加,于是信噪比按 提升。要把信噪比拉高一个数量级,就得平均约 100 份拷贝;要再上一个数量级,得上万份。子断层平均就是干这件事的——但它有个前提:这些拷贝得先在一个难以看清的体内被找出来、定好朝向。
学习型复原在这里格外可贵,因为这个前提本身就被低信噪比卡住了:挑选和分割都是在还没平均的、各向异性又拥挤的体内进行的。CryoWGEN 等修复缺失楔形的方法,能把拥挤断层图的衬度提到足够高,让颗粒挑选与分割有了立足之地,从而把后续平均所需的那些拷贝交到流程手里。