采样与奈奎斯特

在离散网格上记录连续信号会设定一个频率上限,超过它细节即丢失,混叠会破坏频谱

显微镜里的样品是连续的,可探测器只有有限个像素。采样就是用规则网格上的一串取值,去代替那条连续的密度曲线。这一步看似只是”记录”,却悄悄给整套数据划下了一道频率红线:网格不够密,最细的结构不仅记不下来,还会化装成别的东西混进来。本页讲清这道红线在哪、为什么不可逾越,以及它如何决定一幅 Cryo-ET 图能达到的最高分辨率。

设网格间距(像素或体素尺寸)为 Δ\Delta,则采样频率fs=1/Δf_s = 1/\Delta。奈奎斯特–香农定理指出:只有当信号不含高于奈奎斯特频率

fNyq=12Δf_{\text{Nyq}} = \frac{1}{2\Delta}

的频率时,信号才能由其样本精确重建,也就是每两个像素至多容纳一个周期。这里 Δ\Delta 是相邻样本之间的实空间距离,fs=1/Δf_s=1/\Delta 是单位长度内的取样次数,fNyq=fs/2f_{\text{Nyq}}=f_s/2 恰好是采样频率的一半 —— 它是”每个周期至少要采两个点”这句话的频率版本。超过这一极限的频率并不会简单地丢失,而是被折回到采样谱里,伪装成某个更低的频率。这种破坏称为混叠 (aliasing),一旦发生就再也还原不了,因为不同的连续信号会映射到一模一样的样本。

真实正弦样本点混叠正弦

f = 5伪装为 f_alias = 1. 当 fₛ 低于奈奎斯特率 fₛ = 2f 时,同一组样本点也与一条较低频的正弦吻合——高频被折回、伪装成低频。

被折回的频率会落在 00fNyqf_{\text{Nyq}} 之间一个确定的位置:真实频率 ff 以采样率的整数倍为轴做镜像折叠,得到别名频率 falias=ffsround(f/fs)f_{\text{alias}} = |f - f_s\,\mathrm{round}(f/f_s)|。式中 round(f/fs)\mathrm{round}(f/f_s) 是离 ff 最近的采样率整数倍,相减再取绝对值,就把 ff 折叠回 [0,fNyq][0,f_{\text{Nyq}}] 这段基本区间。一旦 fsf_s 跌到 2f2f 以下,这条低频别名与原信号采出的样本就完全一样,二者再也无从区分。

举个具体的数:设像素尺寸 Δ=1.5 A˚\Delta = 1.5\ \text{Å},则 fs=1/1.50.667 A˚1f_s = 1/1.5 \approx 0.667\ \text{Å}^{-1},奈奎斯特频率 fNyq0.333 A˚1f_{\text{Nyq}} \approx 0.333\ \text{Å}^{-1},对应的最高可记录细节约 2Δ=3 A˚2\Delta = 3\ \text{Å}。现在假设真实结构里有一组 0.4 A˚10.4\ \text{Å}^{-1} 的周期纹理(约 2.5 A˚2.5\ \text{Å} 间距),它高于奈奎斯特,于是被折回到 0.40.6670.267 A˚1|0.4 - 0.667| \approx 0.267\ \text{Å}^{-1}(约 3.7 A˚3.7\ \text{Å})。这意味着一组 2.5 A˚2.5\ \text{Å} 的真细节,在图里现身成一组并不存在的 3.7 A˚3.7\ \text{Å} 假纹理 —— 它叠在真信号上,且无法事后剥离。

直觉

表示一个完整振荡至少需要两个像素 —— 一个对应波峰,一个对应波谷。比这更精细的结构无处记录,于是改头换面成一种较粗的虚假图案重新出现。视频里熟悉的车轮倒转现象,就是同一种折叠在时间维度上的版本:辐条转得太快,每帧之间已转过大半圈,相机却”以为”它只倒退了一点点,于是车轮看着在慢慢倒转。空间采样里发生的是同一件事,只是把”帧”换成了”像素”。

在 Cryo-ET 中,样品平面上的像素尺寸由显微镜放大倍率和探测器决定,它设定了后续一切处理所能达到的最高分辨率:比 2Δ2\Delta 更精细的结构根本不在数据里。因此选取像素尺寸是一种权衡:更小的 Δ\Delta 抬高奈奎斯特极限、纳入更精细的细节,却把同样的电子剂量摊到更多像素上,降低了每像素的信噪比。剂量受辐照损伤严格限制,不能随像素变小而成比例加大,所以这条权衡是硬的 —— 一味缩小像素并不能换来更清晰的图,反而可能把信号埋进噪声。

这道红线还规定了重构流程里几个”安全”的操作边界。对一幅图做降采样(合并像素、增大 Δ\Delta)会下移奈奎斯特,因此必须先把新奈奎斯特以上的内容低通滤掉,否则那些频率会折叠进来污染粗图;这正是金字塔式多分辨率处理里”先模糊再抽点”的原因。反过来,对图做升采样或亚像素插值并不能创造新的高频信息:奈奎斯特以上本就是空的,插值只是在已有频率内容之间补点,不会把 2Δ2\Delta 以下的细节变出来。对齐倾转序列时用到的亚像素配准,也依赖这个事实 —— 它能把已记录的频率移到正确位置,却无法恢复采样时就没采到的东西。

深入

以间距 Δ\Delta 采样,等价于把频谱与一个周期为 fsf_s 的狄拉克梳做卷积,使 F(k)F(k) 沿频率轴一份份周期性地复制。换句话说,采样在实空间是”乘以梳状采样函数”,由卷积定理,它在频域就变成”与梳做卷积”,于是原谱被平移 fs,2fs,f_s,\,2f_s,\dots 后一遍遍叠加。若信号的支撑限制在 |k| < f_{\text{Nyq}} 之内,各份副本互不重叠,用一个理想低通滤波器就能还原原信号;一旦超出,副本就彼此重叠相加,这正是混叠 —— 相邻那份副本的高频尾巴漏进了 [0,fNyq][0,f_{\text{Nyq}}],与本份的低频混作一团,再也分不开。实用的防范办法是在采样前先限带 —— 即抗混叠 —— 把奈奎斯特以上的内容模糊掉或滤掉,因为衬度传递函数和探测器包络虽然已经压低了最高频率,却很少能把它们干净地去除。

这也解释了为何探测器的物理特性会进一步压低”有效”奈奎斯特。理想采样假设每个像素是一个点;真实像素却是有面积的小方块,它对落在格内的强度做平均,相当于先与一个像素宽的方窗卷积,再点采。这个方窗在频域是一条 sinc\mathrm{sinc} 包络,在奈奎斯特处把响应压到约 0.640.64,越靠近奈奎斯特越弱。因此实践中常说”有用的频率到不了奈奎斯特”,真正可信的高频上限往往落在 fNyqf_{\text{Nyq}} 的一半到三分之二附近 —— 这一点在做频域滤波和判断分辨率时必须心里有数。

把这条原理放回完整的成像链:奈奎斯特定下”频率红线”,衬度传递函数决定红线以内每个频率被”打几折”、哪里被反转,而中心切片定理缺失楔形则管住”哪些角度方向的频率根本没采到”。三者合起来,圈定了一幅 Cryo-ET 重构在频域里真正拥有的信息。像 CryoGEN 这类方法之所以能补全结构,靠的不是凭空造频率,而是用学到的先验去推断:在这些被采样、被打折、被挖空的约束之外,哪一种完整密度最为自洽。

← 信号处理