同源建模之I-TASSER
I-TASSER (Iterative Threading ASSEmbly Refinement)是一种用于蛋白质结构和功能预测方法。它首先通过多线程方法LOMETS从PDB中识别结构模板,并通过基于迭代模板的碎片组装模拟构建完整的原子模型。接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化,从而预测靶标的功能。
同源建模之I-TASSER
1. I-TASSER简介
I-TASSER (Iterative Threading ASSEmbly Refinement)是一种用于蛋白质结构和功能预测方法。它首先通过多线程方法LOMETS从PDB中识别结构模板,并通过基于迭代模板的碎片组装模拟构建完整的原子模型。接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化,从而预测靶标的功能。在最近的社区范围的比赛CASP7、CASP8、CASP9、CASP10、CASP12和CASP13实验中,I-TASSER(即“Zhang Server”)被列为蛋白质结构预测的首选服务器。在CASP9中,它也是功能预测的最佳工具。该服务器正在积极开发,目标是使用最先进的算法提供最精确的蛋白质结构和功能预测。
2. I-TASSER服务器版
I-TASSER服务器版只需要提交序列(序列大小10-1500个氨基酸)
填写序列、账户和作业名(ID)即可提交至服务器Run I-TASSER

注:在使用服务器前必须先使用教育邮箱注册申请。
3. I-TASSER申请、下载和安装
3.1 注册
使用教育邮箱(.edu)注册申请I-TASSER Suite本地程序。
3.2 下载
下载本地程序I-TASSER5.1.tar.bz2
3.3 安装
tar -xjvf I-TASSER5.1.tar.bz2
cd I-TASSER5.1/
解压完成即可使用。其中I-TASSER5.1/I-TASSERmod/runI-TASSER.pl为主要使用脚本。
3.4 下载依赖库
通过I-TASSER5.1/download_lib.pl脚本下载所需数据,约94 GB.
nohup perl I-TASSER5.1/download_lib.pl -libdir libdir -P true -B true -N true &
4. I-TASSER Suite运行
4.1 下载序列
下载fasta序列,并修改文件名为seq.fasta
wget https://www.uniprot.org/uniprot/P29590.fasta
mv P29590.fasta seq.fasta
4.2 运行runI-TASSER.pl
编写PBS脚本run.qsub进行计算。
qsub run.qsub
run.qsub脚本如下:
#!/bin/bash
#PBS -q q_share
#PBS -V
#PBS -N P29590
#PBS -l nodes=1:ppn=24
#PBS -o /home/homo_model/P29590/log
#PBS -j oe
cd /home/homo_model/P29590/
/I-TASSER5.1/I-TASSERmod/runI-TASSER.pl -libdir /I-TASSER5.1/lib/ -seqname P29590 -datadir /home/homo_model/P29590/ -LBS true
-libdir:是指download_lib.pl所下载库的路径/I-TASSER5.1/lib/
-seqname:是指查询序列的名称
-datadir:是指包含有seq.fasta文件的目录
-LBS true:是指预测ligand-binding site,默认为false
4.3 运行流程
-
standardize
seq.fastatoseq.txtand get the sequence length. -
run
psiblastto generatechk,ou,pssm,mtxfiles.
runPSSpredto getseq.dat,seq.dat.ss.
runsolveto getexp.dat.
runpairmodto getpair1.datandpair3.dat. -
run threading programs sequentially.
runmkinit.plto generate restraints. -
run I-TASSER simulation.
-
run SPICKER clustering program.
runget_cscore.plto get confidence score.
runEMrefinement.plto get full-atomic models.
runget_rsq_bfp.plto get local accuracy and B-factor estimations. -
run
runCOACH.plto generate ligand-binding sites, EC number and .
GO terms predictions.
4.4 结果分析
最终生成5个结构,取C-socre最高构象,辅助参考TM-score值,一般取model1.pdb。
更多推荐



所有评论(0)