术语表

本站用到的 Cryo-ET 与统计机器学习术语,中英对照,每条都链接到展开它的文章。

电子断层成像

Cryo-ET / 冷冻电子断层成像
对一个独一无二的玻璃化样品从多个倾转角成像,再重构出三维结构。
Cryo-EM / 冷冻电镜
用电子对玻璃化样品成像的总称;单颗粒分析与冷冻断层成像是它的两大分支。
Vitrification / 玻璃化
极快冷冻样品,使水凝成无定形的玻璃态冰,从而保住近原生结构。
Tilt series / 倾转序列
随样品台在一定角度范围内倾转而拍下的一组二维投影。
Missing wedge / 缺失楔形
受限倾转范围在傅里叶空间留下的未测区域;它沿电子束方向模糊重构。
Reconstruction / 重构(断层体)
把倾转序列的投影合成为三维体(断层图)。
In situ / 原位
在细胞原生环境中(而非纯化分离后)对分子成像。

Cryo-ET 重构

CryoGEN-I / II
自监督的 Cryo-ET 重构:MAP / 能量先验一代(I)与最优传输一代(II)。
CryoWGEN-I / II
熵正则最优传输的重构,给出玻尔兹曼后验,用 Monte-Carlo(I)或 Langevin / SGLD(II)采样。

结构分析

Subtomogram averaging / 子断层平均
对同一结构的多份拷贝对齐平均,以提升信噪比并补回缺失楔形。
Particle picking / 颗粒挑选
在拥挤的断层图中定位目标结构的实例。
Segmentation / 分割
把断层图划分为膜、细胞器等组成部分。

信号处理

Fourier transform / 傅里叶变换
把信号表示为频率之和——成像与重构的天然语言。
Central-slice theorem / 中心切片定理
一幅投影的傅里叶变换等于物体三维变换的一个过中心切片,把倾转角与频域覆盖联系起来。
CTF / 衬度传递函数
显微镜的频率响应,会在各空间频率上调制并部分反转衬度。
Point-spread function / 点扩散函数
单个点所成的像;物体与之卷积即可建模模糊。
Sampling & Nyquist / 采样与奈奎斯特
为不混叠地捕捉某一频率,信号必须达到的采样精细程度(奈奎斯特极限)。
SNR / 信噪比
信号功率与噪声功率之比;冷冻成像工作在极低信噪比下。
Filtering / 滤波
压制或强调选定频段,以降噪或锐化特征。

概率与统计

Bayesian inference / 贝叶斯推断
用贝叶斯法则,根据观测数据把先验信念更新为后验。
Prior / 先验
在看到数据之前,刻画什么是合理的那个分布。
Posterior / 后验
结合先验与数据之后,关于未知量的分布。
MAP estimate / 最大后验估计
后验下最可能的单点取值——即其众数。
Maximum likelihood / 最大似然
选取使观测数据最可能的参数。
EM algorithm / EM 算法
交替进行隐变量估计(E 步)与参数更新(M 步)的迭代方法。
Entropy / 熵
刻画一个分布不确定性或弥散程度的量。
KL divergence / KL 散度
衡量一个分布相对参考分布差异的非对称量;支撑不一致时为 +∞。

推断与采样

Variational inference / 变分推断
用一个可处理分布族中最接近的成员去近似难解的后验。
ELBO / 证据下界
证据下界;最大化它等价于最小化与真后验的 KL。
Energy-based model / 能量模型
由能量函数定义的分布 p(x) ∝ e^{−E(x)},其归一化常数不可解。
Langevin dynamics / SGLD / 朗之万动力学
用密度的梯度加上注入的噪声来采样;SGLD 是它的随机梯度形式。

最优传输

Optimal transport / 最优传输
把一个分布的质量搬成另一个分布的最小代价方案。
Wasserstein distance / Wasserstein 距离
以最优传输代价定义的分布间距离;即使支撑不相交也有限。
Entropic OT / Sinkhorn / 熵正则最优传输
在传输代价上加一项熵罚,得到平滑、处处为正的耦合,可由矩阵缩放求解。

生成与分布匹配

GAN / WGAN / 生成对抗网络
生成器与判别器对抗训练;WGAN 用 Wasserstein 评论者取代判别器以更稳定。
VAE / 变分自编码器
通过最大化 ELBO 训练、隐空间为概率分布的自编码器。
WAE / Wasserstein 自编码器
用最优传输代价让聚合隐后验匹配先验的自编码器。
AAE / 对抗自编码器
用对抗判别器让隐编码匹配先验的自编码器。
EVIA / 熵变分推断自编码
熵变分推断自编码——CryoWGEN 所实例化的熵正则最优传输框架。
Self-supervised learning / 自监督学习
从数据自身导出的监督信号中学习,不依赖外部标签。