ModelAngelo

ModelAngelo是一个用于冷冻电镜自动原子模型构建的程序。建议使用显存大于8GB的GPU。ModelAngelo在NVIDIA 2080Super及更新的GPU上表现良好。其使用的语言模型所需的权重文件合计需要大概10 GB的硬盘空间。

安装

使用conda管理安装环境,需要先安装conda。下载源代码后使用官方的安装脚本就能自动安装。

git clone https://github.com/3dem/model-angelo.git
cd model-angelo
source install_script.sh

如果顺利的话,现在应该有一个叫model_angelo的conda环境,可以用conda activate model_angelo来激活环境。

然后输入model_angelo build --help来确认是否安装正确了。

未知序列的建模

确保conda环境激活了。然后输入model_angelo build_no_seq --help可以查看未知序列建模的帮助文件。

一般情况下,只需要输入map就可以。

model_angelo build_no_seq -v map.mrc -o output

输出模型会在output/output.cif。

安装完成后第一次运行会下载权重文件,之后就不用了。

然后可以用这个模型去RCSB PDB数据库进行结构相似性比对,或者直接拿预测的序列进行blast,就能知道蛋白是什么。前者的成功率一般会高一点,因为单从密度精确判断氨基酸种类对分辨率要求还是比较高的,可以手动确认验证一下。

已知序列的建模

确保conda环境激活了。然后输入model_angelo build --help可以查看已知序列建模的帮助文件。

需要输入map和蛋白质序列fasta文件。

model_angelo build -v map.mrc -pf prot.fasta -o output

也可以有dna或者rna序列。

model_angelo build -v map.mrc -pf prot.fasta -df dna.fasta -rf rna.fasta -o output

输出模型会在output/output.cif。

build和build_no_seq的权重文件是不一样的,第一次运行会下载权重文件,之后就不用了。

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注