使用Modeller对蛋白质进行同源建模

# Anaconda 

一、modeller下载与安装

输入key码:MODELIRANJE

 

做下Basic Modeling 流程吧:

 

在python环境下运行下例子吧:(build_profile.py、compare.py、align2d.py、model-single.py、evaluate_model.py)

(这里还需要一个evaluate_template文件)

二、使用modeller对目的蛋白序列同源建模

>p1:dfra12

MNSESVRIYLVAAMGANRVIGNGPNIPWKIPGEQKIFRRLTEGKVVVMGRKTFESIGKPLPNRHTLVISRQANYRATGCVVVSTLSHAIALASELGNELYVAGGAEIYTLALPHAHGVFLSEVHQTFEGDAFFPMLNETEFELVSTETIQAVIPYTHSVYARRNG

1、添加额外的库

Blast与PDB搜索,额外从公共数据库选两个相似蛋白来作为模版:2ZZA A    3JVX A(发现挑重复了于是我换了一个)

>P1;2ZZAA

structure:2ZZA: 1:A:

VIVSMIAALANNRVIGLDNKMPWHLPAELQLFKRATLGKPIVMGRNTFESIGRPLPGRLNIVLSRQTDYQPEGVTVVATLEDAVVAAGDVEELMIIGGATIYNQCLAAADRLYLTHIELTTEGDTWFPDYEQYNWQEIEHESYAADDKNPHNYRFSLLERVK

>3JVX:A|PDBID|CHAIN|SEQUENCE

HHHHHHMRVSFMVAMDENRVIGKDNNLPWRLPSELQYVKKTTMGHPLIMGRKNYEAIGRPLPGRRNIIVTRNEGYHVEGCEVAHSVEEVFELCKNEEEIFIFGGAQIYDLFLPYVDKLYITKIHHAFEGDTFFPEMDMTNWKEVFVEKGLTDEKNPYTYYYHVYEKQQ

将数据库中的模版序列按下面格式添加入:pdb_95.pir中:

2、运行build_profile.py:修改代码

aln.append(file='dfra12.ali',alignment_format='PIR',align_codes='ALL')行。

Selecting a template(模版)

挑选E值为0,相似度大于35的序列:3dfr、1ra9、1df7A、1vdrA以及添加的2ZZAA、3jvxA,共五个模版,同时在PDB中下载对应的模版文件。

3、运行compare.py:

使用compare.py模版之间的结构和序列相似性。(修改对应的PDB)

输出结果如下:

分析下:1ra9A与2ZZAA具有几乎相同的结构和序列,1ra9A有更好的晶体结构,选1ra9A。3dfrA与1df7A也可以选,它们也有相似的结构域,分辨率也不错。

4、运行align2d.py:

dfra12分别与模版比对(1ra9A、3dfrA、1df7A)

修改并运行程序:

得到两个文件(dfra12-1ra9A ali与pap格式文件),打开pap格式文件:

同理再运行两次:

3dfrA:

1df7A:

5、运行model-single.pydfra12三维建模:

获得了dfra12-1ra9A类似的文件就可以进行三维建模了。(1ra9A、3dfrA、1df7A)——这里还可以再跑两轮,我就没跑了,重复的过程,所以对选择会有点偏差,但是足够建模。(最后我还是跑了下)

 

 

由此可以得出不同的pdb文件:选molpdf和DOPE scroe高的模型,这里选第三个dfra12.B99990001。(1df7A)

用Chimera打开模型:

 

6、模型评估:(evaluate_model、plot_profiles)选dB1评估

运行evaluate_model:

得到:dfra12.profile文件;score : -15616.977539

运行evaluate_template.py:

得到:1df7A.profile文件;score: -17980.896484

运行plot_profiles:函数块之后的代码截图如下,

  

(residue-alignment)

 相关文件:

链接:https://pan.baidu.com/s/1zKisFWJjtO2bdnxdO9Oncw
提取码:bfk3

原文地址:https://www.cnblogs.com/lhsguaigege/p/10101965.html