RELION5.0开发了一套新的完整的Subtomogram averaging流程,从收集的mdoc文件和原始Movies数据开始,可以到最终使用Model Angelo的自动模型构建结束。教程使用5套HIV-1 dMACANC VLPs的Tilt Series测试数据集,原始数据可以在EMPIAR数据库下载TS_01,TS_03,TS_43,TS_45,TS_54五套照片以及mdoc文件。
。
导入数据
首先创建一个测试用的目录relion_tomo_tutorial,将下载的数据集放进来。创建一个mdoc目录并把mdoc文件放进去,创建一个frames目录并把所有照片放进去。
应该是这样一个目录结构:
relion_tomo_tutorial │ └───mdoc │ TS_01.mrc.mdoc | TS_03.mrc.mdoc │ TS_43.mrc.mdoc | TS_45.mrc.mdoc │ TS_54.mrc.mdoc │ └───frames │ TS_01_000_0.0.mrc | TS_01_000_3.0.mrc │ TS_01_000_-3.0.mrc | ... │ TS_03_000_0.0.mrc │ TS_03_000_3.0.mrc | TS_03_000_-3.0.mrc │ ...
然后进入自己的工作目录,打开RELION TOMO的界面:
cd path/to/relion_tomo_tutorial
relion --tomo
点击左侧Import
,在General
版块中:
Tilt image files: frames/*.mrc mdoc files: mdoc/*.mdoc Pixel size: 0.675 Voltage: 300 Spherical aberration: 2.7 Optics group name: optics1
在Tilt serials
版块中,
Dose rate per tilt: 3 Tilt axis angle: 85
这些是这套测试数据的参数,实际的数据根据自己电镜参数修改。点击Run
。如果正常成功,Log中应该出现Wrote STAR files for 5 tilt-series.
漂移校正
对收集的Muti-frames照片进行漂移校正,可以用MotionCor2或者RELION5自带的算法,这里就直接用自带的了。
点击左侧Motion correction
,在I/O
版块中:
Input tilt serials: Import/job001/tilt_series.star # Browse选择刚刚Import生成的star文件 EER fractionation: 32 # 默认的不用改,因为这套数据不是eer格式的。但是如果收的eer格式,就对应方法改就行 Write output in float16?: Yes # 推荐Yes节省空间 Save sum of power spectra?: Yes # 非剂量加权功率谱总和可为CTF估算提供更好的信号。另外,CTFFIND4无法读取float16照片,因此选了float16就必须选 Save images for denoising?: Yes # 这套测试数据质量很好,不需要Denoise也有很好的衬度。如果后续需要用cryoCARE做Denoise,选Yes会单独存一份
在Motion
版块中:
B-factor: 150 # 根据自己数据的信噪比可以适当调高,测试数据质量很好,默认不用改 Number of pathes X, Y: 1 1 # tomo数据每帧电子剂量很低,最好不用patches Binning factor: 2 # 测试数据是super-resolution模式收集的,bin2后pixel size是1.35Å Gain-reference image: # 测试数据已经gain-corrected了,如果有gain这里选gain。Gain rotation和flip也是按自己情况选 Use RELION’s own implementation: Yes # 这里选择用RELION自带的算法
在Running
版块中选择合适数量的MPI和Threads,然后点击Run
。一般几分钟就做完了。
CTF计算
然后使用CTFFIND-4.1,可以在找到对应版本并下载到本地,是一个单独的可执行文件。
点击左侧CTF estimation
,在I/O
版块中:
Input tilt serials: Import/job002/corrected_tilt_series.star # Browse选择刚刚做完motion的文件
在CTFFIND-4.1
版块中:
CTFFIND-4.1 executable: /path/to/ctffind # 选择下载的ctffind可执行文件 Use power spectra from MotionCorr job?: Yes # 使用刚刚Motion correction job生成的PS Minimum resolution (A): 50 # CTF estimation的最低分辨率。根据自己的数据集修改 Maximum defocus value (A): 5 # CTF estimation的最高分辨率。根据自己的数据集修改 Minimum defocus value (A): 5000 Maximum defocus value (A): 50000 Defocus step size (A): 500 Nominal defocus search range (A): 10000 # 如果给的是正值,会忽略上面三个参数,而使用mdoc文件中提供的defocus的±此值来搜索defocus。
在Running
版块中选择合适数量的MPI,然后点击Run
。一般几十秒就做完了。
筛选照片
通常,Tilt series中的一些角度的照片有一些问题,比如载网挡住了视线导致一些全黑的视角。我们可以使用 Exclude tilt-images
任务将这些图像移除。
Input tilt series: CtfFind/job003/tilt_series_ctf.star Number of cached tilt series: 5 # 这个是一次缓存几张照片供挑选,卡顿的话可以减小
点击Run
,会弹出Napari的窗口。右侧是每个倾转角的照片,如果有不想要的将其左侧的勾去掉就行,然后点击右下角的Save star file。一般重点关注一下大倾角的位置有没有被挡住,像TS_01和TS_43的-60°的照片就是完全黑的,排除掉。
对齐tilt-series
RELION5包装了对AreTomo2和Imod的接口,用于方便地进行断层图对齐。由于这套测试数据添加了金基准颗粒,可以用Imod进行对齐。实际可以对比不同方法的结果来选择。
点击左侧Align tilt-series
,在I/O
版块中:
Input tilt series: ExcludeTiltImages/job004/selected_tilt_series.star Batchruntomo executable: # 在安装的IMOD/bin下有一个batchruntomo可执行文件,选它 AreTomo2: # AreTomo2编译完就是一个可执行文件。这里我们不用它,不管它也行
在IMOD
版块中:
Use IMOD’s fiducial based alignment?: Yes Fiducal diameter (nm): 10 Use IMOD’s patch-tracking for alignment?: No
在Running
版块中选择合适数量的MPI,点击Run
。
重构断层图
对齐了之后就可以重构出断层图了。
点击左侧Reconstruct tomograms
,在I/O
版块中:
Input tilt series: AlignTiltSeries/job005/aligned_tilt_series.star Generate tomograms for denoising?: Yes # 为了后面示范Denoise
在Reconstruct
版块中:
Unbinned tomogram width (Xdim): 4000 Unbinned tomogram heigth (Ydim): 4000 # 测试数据的大小是3710 x 3838,这里用的X和Y数值比它略大,确保覆盖所有像素 Unbinned tomogram thickness (Zdim): 2000 # 2000对于测试数据厚度合适,自己的数据可以试几个不同的值看看 Binned pixel size (A): 10 # bin来减少运算量和存储压力,一般也足以用于挑颗粒
去噪
RELION5包装了cryoCARE的接口用来调用cryoCARE对断层图去噪,需要先安装cryoCARE。
只有在前面Motion correction
的Save images for denoising?和Reconstruct tomograms
的Generate tomograms for denoising?都设置为Yes时,才能进行Denoise。
Denoise分为两步,用的都是同一个Job,设置不同参数。第一步是训练神经网络,第二步是将训练好的神经网络应用到所有层析图上,得到去噪后的层析图。
选择左侧的Denoise tomogram
,在I/O
面板:
Input tomograms.star: Tomograms/job006/tomograms.star Directory with cryoCARE execuables: # 选择安装cryoCARE的目录 Which GPU to use: 0
在CryoCARE: Train
面板:
Train denoising model: Yes Tomograms for model training: TS_01:TS_03:TS_43:TS_45:TS_54 # 用冒号隔开,输入的是Tilt series的前缀名称 Number of sub-volumes per tomogram: 1200 Sub-volume dimensions (px): 72
在CryoCARE: Predict
面板:
Generate denoised tomograms: No
点击Run
。训练需要的时间比较久,需要个把小时吧。
训练完成后就可以Predict了。
重新再次选择左侧的Denoise tomogram
,I/O
面板不变,在CryoCARE: Train
面板:
Train denoising model: No
在CryoCARE: Predict
面板:
Generate denoised tomograms: Yes Path to denoising model: Denoise/job007/denoising_model.tar.gz # 选择刚刚训练Job的这个tar.gz压缩文件模型
点击Run
。预测就很快了,几分钟就好了。
去噪的图像可以用IMOD或者Napari等软件查看,去噪的断层图仅仅用来挑选颗粒。
挑选颗粒
tomogram的话到重构断层图就可以了,然后可以用别的软件进行segment。如果要后续做sub-tomogram averaging,挑选颗粒算是一个重要的也是困难的地方。RELION5-TOMO内有一个基于Napari的手动颗粒挑选程序,目前支持三种方式挑选颗粒:一是球体挑选,适合用于病毒表面蛋白;二是细丝挑选,适合一些filaments的结构;三是直接手动挑选蛋白颗粒,适合一些随机空间分布的比如核糖体颗粒;另外还有一个没开发完的方法,基于膜表面的颗粒挑选,这个选项,但是暂时还用不了,不要选它。
选择左侧的Pick tomograms
,在I/O
面板:
Input tomograms.star: Denoise/job008/tomograms.star Picking mode: sphere # 还有particles, filaments和surfaces,这套数据是病毒,因此选sphere Particle spacing (A): 60 # HIV衣壳蛋白间距在75Å,选择小一点以免错过颗粒 Input particles.star (optional): # 可以加载现有的颗粒坐标文件,模式默认为particles
点击Run
,会打开Napari的界面。
左下角显示了选择不同断层图列表和保存按钮。
-
鼠标左键旋转视图。
-
在主界面上Alt+左键可以添加一个球,按R键可以修改球的半径,将其半径扩大到你的鼠标的位置。
-
按N键可以完成添加,选择下一个球,否则再按Alt+左键就是移动球的位置。
-
按Shift+左键拖拽可以在Z轴移动,在不同的倾角照片上挑选位置。
我们要做的就是通过移动Z轴,找到病毒看起来半径最大的样子,这个Z值就是它的中心截面,此时添加一个球,并修改半径使其和病毒一样大,这样就会在这个球的表面间隔一定距离自动挑选颗粒。将所有断层图都挑选完,保存并关闭窗口。
如果是filaments,那么就用Alt+左键勾勒filament轨迹,N键添加新的。
Particles就更简单,直接添加就行。
提取颗粒
有了颗粒坐标,就可以从Tilt series提取颗粒。不同于单颗粒,由于是tomogram,因此提取颗粒的形式可以是3D volume,也可以是2D image stack,为了区别于真正的3D tomogram,将这称为pseudo-subtomograms。
2D image stack占用更少硬盘空间,而且在重构和refine过程中省去了在三维空间进行插值的步骤,避免引入一些artifacts,在后续3D refine中结果一般会更好一点,RELION5默认改成推荐使用2D image stack。(在3D intial reference的VDAM算法中,3D的效果可能会好一些)
为方便调用,pseudo-subtomograms在RELION里使用一个optimisation set的STAR文件来统一描述,融合了particle star和tomogram star(如果做Bayesian polishing
还有trajectory star)。在做完Bayesian polishing
或CTF refinement
后需要重新提取pseudo-subtomograms。
选择左侧Extract subtomo
任务,在I/O
面板:
Input optimisation set: Picks/job009/optimisation_set.star OR: use direct entries?: No Input particle set: Input tomogram set: Input trajectory set:
在Reconstruct
面板:
Binning factor: 6 Box size (binned pix): 192 Cropped box size (binned pix): 96 # 在CTF pre-multiplication后,最终实际的提取尺寸 Maximum dose (e/A^2): 50 # 高于此剂量的Tilt series将被pseudo-subtomogram排除 Minimum nr.frames: 1 # 最少要在这个数量的frame中可见的颗粒才被提取 Write output as 2D stacks?: Yes Write output in float16?: Yes
在Running
版块中选择合适数量的MPI,点击Run
。在Extract subtomo
、Reconstruct particle
、CTF refinement
、Bayesian polishing
中,每个MPI会处理一套数据,设置数量不要超过tomogram数量。
导入颗粒坐标
和上面一步提到的一样,颗粒挑选在实际数据中并不一定那么简单,也可以结合别的的软件来挑选,比如TomoTwin,DeePiCt,DeepFinder,CrYOLO,STOPGAP,MemBrain等。这一步在本套教程中不需要做。
假设坐标文件在PARTICLE_COORDS目录下,每个tomogram对应一个例如rec_TS_01.coords、rec_TS_03.coords的文件。
点击左侧Import
,在Coordinate
版块中:
Or Import coordinates instead?: Yes Input coordinates?: PARTICLE_COORDS/rec_TS_* Remove substring from filenames: rec_ Second substring to remove: .coords Text files contain centered coordinates?: No Multiply coords in text files with: 7.407407 # 如果坐标是相对于去噪图的,因为bin过,所以要乘以(10÷1.35),这样才能对应上Motion correction的原始图大小 Add this to coords in text files: 0
在这个Job中就可以找到创建的particles.star文件,可以用于后续的Extract subtomos
任务:
Input optimisation set: OR: use direct entries?: Yes Input particle set: Import/jobXX/particles.star Input tomogram set: Denoise/job008/tomograms.star
初始三维模型生成
由于前面在挑选颗粒是用sphere模式在球体表面挑选颗粒,因此理论上是有大致的初始角度信息的,即垂直于球体表面。所以可以直接在先验知识上进行三维重构。
这里给了一个演示,如何用VDAM算法在没有任何先验知识的情况下生成Reference map。
选择左侧3D intial reference
任务,在I/O
面板:
Extract/job010/optimisation_set.star
CTF
面板不用改,在Optimisation
面板:
Number of VDAM mini-batches: 100 # 迭代循环次数 Regularisation parameter T: 4 # 实验数据和先验数据的权重,初始重构用2-4比较合适 Number of classes: 1 # 这套数据均一性很好。另外的情况下增大这个数有可能将一些次优的颗粒剔除到另一个类 Mask diameter (A): 500 Flatten and enforce non-negative solvent: Yes Symmetry: C6 # 这个蛋白是C6对称性的,这个根据自己蛋白的情况选择 Run in C1 and apply symmetry later: Yes # 在实际refine中不添加对称性收敛的会更好,在refine之后再添加对称性 Prior width on tilt angle (deg): 10 # 因为知道颗粒是垂直于球体表面的,所以可以给出这个先验角度
在Compute
面板:
根据服务器性能适当修改,选择合适的GPU
在MPI
面板:
Number of MPI procs: 1 # 这个算法对于多MPI支持不是很好
点击Run
。这个运行时间比较久,得个把小时。
三维重构
通过使用颗粒文件中给出的位置和方向对颗粒进行平均,从颗粒集生成Reference map。由于这里用sphere方式挑选的颗粒是可以获得理论先验角度信息的,因此也可以使用之前提取的颗粒直接重构。
选择左侧Reconstruct particle
任务,在I/O
面板:
Input optimisation set: Extract/job010/optimisation_set.star OR: use direct entries: No Input particle set: Input tomogram set: Input trajectory set:
在Average
面板:
Binning factor: 6 Box size (binned pix): 192 Cropped box size (binned pix): 96 Wiener SNR constant: 0 Symmetry: C6
在Running
版块中选择合适数量的MPI,点击Run
。
在bin6下初始3D refine
通过前面生成了Reference map,就可以用3D auto-refine
进行refine。由于Sub-tomo占用更多内存资源,建议从高bin值逐渐降低到1。这里我们先直接用之前的bin 6的数据集。
选择左侧3D auto-refine
任务,在I/O
面板:
Input optimisation set: Extract/job010/optimisation_set.star OR: use direct entries?: No Input particle set: Input tomogram set: Input trajectory set: Reference map: Reconstruct/job011/merged.mrc Reference mask (optional):
在Reference
面板:
Ref. map is on absolute greyscale?: Yes Resize reference if needed?: Yes Initial low-pass filter (A): 60 Symmetry: C6
在Optimisation
面板:
Mask diameter (A): 500 # 因为第一轮refine用的96的box(96×8.1=777.6Å),所以需要一个大一点的mask,等后面再继续缩小mask和bin推高分辨率
在Auto-sampling
面板:
Prior width on tilt angle (deg): 10 # 类似于前面3D intial说的
在Compute
版块选择GPU和算力,Running
版块中选择合适数量的MPI和threads。注意这个任务至少需要3个MPI,一个作为leader,另外两个处理两个half-sets,且最好是奇数。点击Run
。
在bin2下3D refine
算完这轮之后可以再从bin6提高到bin2继续提高分辨率。
-
提取颗粒
重新提取bin2的颗粒,选择Extract subtomos
,在I/O
版块:
Input optimisation set: Refine3D/job012/run_optimisation_set.star
在Reconstruct
版块,这次给binning factor为2:
Binning factor: 2 Box size (binned pix): 256 Cropped box size (binned pix): 128
其它参数和一样。Run
。
-
重构颗粒
同样,我们还需要一个bin2下的Reference,选择Reconstruct particle
,在I/O
面板:
Input optimisation set: Extract/job013/optimisation_set.star OR: use direct entries?: No
在Average
面板:
Binning factor: 2 Box size (binnied pix): 256 Cropped box size (binned pix): 128 Symmetry: C6
其它参数和之前初始三维模型生成一样。Run
。
-
Refine
接下来就可以在bin2下再做一次3D auto-refine了
,在I/O
面板:
Input optimisation set: Extract/job013/optimisation_set.star # bin2的颗粒 OR: use direct entries?: No Reference map: Reconstruct/job014/half1.mrc
在Reference
面板:
Ref. map is on absolute greyscale?: Yes Resize reference if needed?: Yes Initial low-pass filter (A): 20 # 略低于上一步refine达到的分辨率 Symmetry: C6
在Optimisation
面板:
Mask diameter (A): 230 # 因为第一轮refine用的96的box(96×8.1=777.6Å),所以需要一个大一点的mask,等后面再继续缩小mask和bin推高分辨率
选择合适的GPU、MPI和Threads,Run
。
删除重复颗粒
在继续bin1下进行最终refine之前,可能需要丢弃那些重复的颗粒或者低质量的颗粒,确保最后的refine能推进到更高分辨率并且避免虚高的分辨率。
选择左侧的Subset selection
任务,在I/O
选项卡内填入particle栏:
OR select from particles.star: Refine3D/job015/run_data.star
在Duplicate
选项卡:
OR: remove duplicates?: Yes Minimum inter-particle distance(A): 30 # 两个衣壳蛋白理论相距75Å左右,所以位置大约小于一半这个值的颗粒有可能就是一个颗粒
三维分类
通过remove duplicate删除了重复的颗粒,还可以再通过三维分类来去除低质量的颗粒,为后续最后的高分辨率重构做准备。
选择3D classification
任务,在I/O
选项卡:
Input optimisation set: OR: use direct entries?: Yes # 我们对颗粒进行了删除,因此不能直接用optimisation set了 Input particle set: Select/job016/particles.star Input tomogram set: Denoise/job008/tomograms.star # Tomogram还是一样 Reference map: Refine3D/job015/run_class001.mrc
在Reference
选项卡:
Initial low-pass filter (A): 60 Symmetry: C1 # 不是为了推分辨率,所以给C1还能去掉一些非对称的坏颗粒
在Optimisation
选项卡:
Number of classes: 9 # 考虑自己的机器算力,分类越多需要更多的计算成本 Mask diameter (A): 230
在Sampling
选项卡:
Perform image alignment?: Yes Angular sampling interval: 1.8 degrees Perform local angular searches?: Yes # 为了搜索那些和Reference对齐的颗粒而不是分出更多状态 Prior width on tilt angle (deg): 10
设置GPU、MPI和Threads,Run
。可能需要几个小时。
完成后通过Display可以查看结果。
通过Subset selection
这个任务,可以挑出想留下的类,在I/O
选择:
Select classes from job: Class3D/job017/run_it025_optimiser.star
其它的选项保持默认值,注意之前删除重复颗粒时调整过remove duplicates?这个参数给它改回去No。
Run
弹出UI设置展示参数,点击Display
,然后选择好的类(红色框起来),右键点击Save selected classess来保存选择结果。关闭窗口。
在bin1下3D refine
类似地,需要重新提取颗粒并生成Reference map,在Extract subtomos
和Reconstruct particle
各自的任务下都选择来自三维分类的挑选的颗粒和原来的tomogram:
Input optimisation set: OR: use direct entries?: Yes Input particle set: Select/job018/particles.star Input tomgoram set: Denoise/job008/tomograms.star Input trajectory set:
在Extract subtomos
的Reconstruct
选项卡和Reconstruct particle
的Average
选项卡中,分别都选择binnig factor 1:
Binning factor: 1 Box size (binned pix): 512 Cropped box size (binned pix): 192
再次选择3D auto-refine
任务,在I/O
选项卡中:
Input optimisation set: Extract/job020/optimisation_set.star Reference map: Reconstruct/job021/half1.mrc # 当提供的Reference map名字为*half?*.mrc时,两个halfmap会自动分配给对应的half-set Reference mask (optional): mask_align.mrc
在Reference
选项卡中:
Ref. map is on absolute greyscale?: Yes Resize reference if needed?: Yes Initial low-pass filter (A): 5.5 # 低通滤波到略高于上一步bin2得到的分辨率,这里时在bin2条件下Nyquist分辨率极限(2倍pixel size) Symmetry: C6
在Optimisation
选项卡中:
Mask diameter (A): 230 Mask individual particles with zeros?: Yes Use solvent-flattened FSCs?: Yes # 使用提供的reference_mask,改善FSC评估 Use Blush regularisation?: No
在Auto-sampling
选项卡中:
Initial angular sampling: 1.8 degrees
然后选择适当的计算资源Run
。
Post-processing
结束后可以再次通过Subset selection
来剔除间隔小于50Å的颗粒确保没有重复颗粒,然后用Reconstruct particle
重构新的reference。
mask可以在ChimeraX或者Dynamo之类的软件内做,RELION也提供了一个程序做mask。
选择Mask creation
,在I/O
里:
Input 3D map: Refine3D/job0xx/run_class001.mrc
在Mask
选项卡里:
Lowpass filter map (A): 15 Pixel size (A): -1 # 下面三个值对map进行的处理需要根据实际情况反复调整一下,可以用ChimeraX等软件打开map调整threshold以及结果mask看看效果 Intial binarisation threshold: 0.01 Extend binary map this many pixels: 3 Add a soft-edge of this many pixels: 8
点击Run
,多尝试几种参数,并查看生成的mask,直到生成一个不错的mask。
通过Post-processing
来进行sharpen并在tight-mask下进行FSC分辨率评估,在I/O
选项卡中:
One of the 2 unfiltered half-maps: Reconstruct/job025/half1.mrc Solvent mask: mask_fsc.mrc # 这个tight mask应该仅包含目的蛋白区域
到这里理论能达到4Å的分辨率map。
Tomo refinement
接下来还可以基于颗粒对CTF、倾转角度、漂移等优化,包括CTF refinement
和Bayesian polishing
,做着两个任务的顺序不重要,并且可以反复进行多轮优化。
选择CTF refinement
,在I/O
选项卡:
Input optimisation set: OR: use direct entries?: Yes # 因为前面remove duplicate了,否则可以直接用3D auto-refine的optimisation set Input particle set: Select/job024/particles.star Input tomogram set: Denoise/job008/tomograms.star Input trajectory set: # 第一轮可以没有,Bayesian polishing会生成motion.star,如果包含在optimisation set也行 One of the 2 reference half-maps: Reconstruct/job025/half1.mrc Reference mask: mask_align.mrc Input postprocess STAR: PostProcess/job026/postprocess.star
在Defocus
选项卡:
Box size for estimation (pix): 512 Refine defocus?: Yes Defocus search range (Å): 3000 Do defocus regularisation?: Yes Defocus regularsation lambda: 0.1 Refine constrast scale?: Yes Refine scale per frame?: Yes Refine scale per tomogram?: No
选择MPI和Threads,Run
。结束后用这个生成的optimisation_set.star进行Reconstruct particle
和 Post-processing
,官方描述能到3.87Å。生成的reference map和postprocess文件可以用于后面Bayesian polishing
。
选择Bayesian polishing
,在I/O
面板:
Input optimisation set: CtfRefine/job027/optimisation_set.star OR: use direct entries?: No One of the 2 reference half-maps: Reconstruct/job028/half1.mrc Reference mask: mask_align.mrc Input postprocess STAR: PostProcess/job029/postprocess.star
在Polish
面板:
Box size for estimation (pix): 512 Max position error (pix): 5 Align by shift only?: No
在Motion
面板:
Fit per-particle motion?: Yes Sigma for velocity (Å/dose): 0.2 Sigma for divergence (Å): 5000 Use Gaussian decay: No
选择MPI和Threads,Run
。结束以后会在结果里发现tomograms.star、particles.star和motion.star三个文件,用这三个可以重新Extract subtomos
,然后再Reconstruct particle
和Post processing
,最终能到达3.65Å分辨率。
自动原子建模
RELION5中集成了ModelAngelo,这也是RELION作者Sjors Scheres课题组自己开发的自动原子建模软件,能基于map自动搭建pdb结构。
虽然支持未知建模,但是如果已知氨基酸序列文件更好,在RCSB PDB数据库能找到并下载这套数据蛋白的fasta序列文件。
选择ModelAngelo
,在I/O
面板:
B-factor sharpened map: PostProcess/job079/postprocess_masked.mrc FASTA sequence for proteins: rcsb_pdb_5L93.fasta
如果没有序列,也可以通过序列比对HMMer序列搜索。