FSC曲线

分辨率往往是衡量冷冻电镜结构质量的最重要指标之一。然而,这也导致了有时过度重视分辨率的数值而不审视map的实际重构结果的情况。正确认识电镜分辨率的含义是很重要的。

分辨率

在传统光学领域,分辨率的定义是能够区分两个独立点的最小距离。传统的光学显微镜分辨率极限受到光的波长和衍射的限制,而电子的波长大约是0.02Å,远小于原子的尺寸,且衍射的影响比较小。因此在现实中,比如透镜相差、样品漂移、电子束时空相干性等因素其实更大程度上影响了电子显微镜分辨率。高端精密的电镜能很大程度克服这些限制,分辨率可达1Å以内。然而,在冷冻电镜中,我们看到的高分辨率结构分辨率也大多只在2-5Å,它的主要限制因素往往是辐照损伤(radiation damage)。生物样品能承受的电子辐照是很低的,因此只能降低电子剂量,从而导致信噪比降低。在冷冻电镜中,用到了傅里叶变换三维重构,分辨率一词,与其说是用来描述map的模糊程度,更准确地说是描述可靠数据在结构内扩展到的最高空间频率。直观地说,电镜分辨率最好用频谱信噪比(SSNR)来表示,它表示了在某一个空间频率内信号强度和噪声强度的比值。因为种种原因,现在常常不直接使用SSNR来表示分辨率,而是使用FSC。

傅里叶壳层相关系数

FSCFSC,Fourier shell correlation,顾名思义,它表示了在傅里叶空间中两个独立计算的map的相关性。在傅里叶空间中的每一个壳层代表了在所有方向上具有特定空间周期的特征。壳层的半径定义了周期性,较大的壳层代表较小的周期性(更精细的细节,即高分辨信息),壳层上的位置定义了方向。

当计算两个不同map中同一壳层中的值之间相关性的平均值时,将产生一个范围从1(完全相关)到0(不相关)到-1(完全反相关)的值。计算所有壳层的平均值,并将其表示为曲线,其中空间频率(通常表示为s)在x轴上,相关系数在y轴上。系数为1表示完全一致,即没有噪声。系数为0表示没有相关性,即纯噪声。经典的FSC曲线在低空间频率下开始于1.0附近,在高分辨率下下降到0.0附近。注意:空间频率是空间周期的倒数,我们的横坐标是分辨率的倒数1/Å。

因此,我们也可以理解了,通过FSC计算的冷冻电镜的分辨率与真实空间map中可见的细节水平无直接相关。如果一个3Å 的map显示出清晰的高分辨率特征,应用高斯低通滤波器模糊操作,生成的map高分辨率细节会变少,但FSC评估的分辨率将完全不变。虽然科学家作出了很多努力来让分辨率尽可能地准确,但是噪声分布在所有的空间频率,而且人的视觉上允许多少噪声出现在map里是非常依赖于经验的。我们常常在处理软件中看到的gold-standard FSC(GSFSC),就是以完全独立的方式将颗粒分成奇数和偶数两组,对两个map进行计算重构,并计算相关系数。而我们常听到的FSC Threshold 0.143是广泛采用的冷冻电镜分辨率阈值,它是早期科学家以尽可能模拟类似X射线衍射分辨率所对应的map质量计算的,尽可能使在这个阈值下的相关系数代表的分辨率的数值具有普遍参考性。

mask在分辨率评估中的影响

我们会注意到在FSC曲线中往往含有一条masked和一条unmasked曲线,甚至有一条tight曲线。这是由于前面提到FSC计算的是整个volume的FSC平均值,在没有mask的情况下,溶剂信号就是噪音信号,尤其是当box size增大时,噪音信号就更强了,相关系数就会降低。解决办法就是添加一个mask甚至tight mask,将mask外的信号相对值等同于溶剂平均值,使得FSC的值专注于重构的颗粒内部。然而,在FSC计算之前添加mask也导致了mask可能对FSC产生影响。如果在两个half-map上使用相同的mask,mask的边缘过于锐利,那么mask本身的形状将产生一定的高分辨率相关性,导致overfitting。

为了避免这种情况发生,我们使用的mask必须有一个柔和变化的边缘。所以在电镜数据处理软件中创建或处理mask的时候会有一个soft的选项,能够尽可能避免许多情况的overfitting。

cryoSAPRC Volume Tools

Relion Mask Creation

Reference: Robert M Glaeser, Eva Nogales, Wah Chiu. Single-particle cryo-EM of Biological Macromoleculars. 2021.

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注