pdb模块进行python程序调试,python中pdb的使用教程
Biopython PDB模块
Biopython PDB模块详细操作教程
Biopython提供了传记。操纵多肽结构的PDB模块。PDB(蛋白质数据库)是最大的蛋白质结构在线资源。它具有许多不同的蛋白质结构,包括蛋白质-蛋白质、蛋白质-DNA和蛋白质-RNA复合物。
要加载PDB,请键入以下命令-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
fromBio。PDB进口*
1.蛋白质结构文件格式
PDB将蛋白质结构分成三种不同的形式
Biopython不支持基于XML的文件格式。
Pdb文件格式,这是一种特殊格式的文本文件。
PDBx/mmCIF文件格式。
蛋白质数据库分发的PDB文件可能包含格式错误,这将使它们不明确或难以解析。传记。PDB模块试图自动处理这些错误。Bio.pdb模块实现了两种不同的解析器,一种是mmCIF格式,另一种是pdb格式。
让我们学习如何详细解析每种格式-
1.1.mmCIF解析器
使用以下命令从pdb服务器下载mmCIF格式的示例数据库-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
pdbl=PDBList()
pdbl.retrieve_pdb_file(2FAT ,pdir=。,file_format=mmCif )
它将从服务器下载指定的文件(2fat.cif)并存储在当前工作目录中。
在这里,PDBList提供了从在线PDB FTP服务器列出和下载文件的选项。lve _ pdb _ file方法需要下载文件的名称,不带扩展名。Resolve_pdb_file也可以选择指定下载目录-pdir和文件格式-file_format。文件格式的可能值如下-
MmCif(默认,PDBx/mmCif文件)
Pdb格式
Xml (PMDML/XML格式)
高度压缩的
捆绑包(大型结构的PDB格式存档)
要加载CIF文件,请使用Bio。MMCIF.MMCIFParser如下所示-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
parser=MMCIFParser(QUIET=True)
data=parser . get _ structure( 2FAT , 2FAT.cif )
在这里,QUIET将在分析文件时禁止显示警告。Get_structure将解析文件并返回ID为2FAT的结构(第一个参数)。运行上述命令后,它将解析文件并打印可能的警告(如果有的话)。现在,使用以下命令检查结构-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
数据
若要获取类型,请使用下面指定类型方法,
打印(类型(数据))
这样就成功解析了文件,得到了蛋白质的结构。在下一章,我们将学习蛋白质结构的细节以及如何获得它。
1.2.PDB分析器
使用以下命令从PDB服务器下载pdb格式的示例数据库-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
pdbl=PDBList()
pdbl.retrieve_pdb_file(2FAT ,pdir=。,file_format=pdb )
这将从服务器下载指定的文件(pdb2fat.ent ),并将其存储在当前工作目录中。要加载pdb文件,请使用Bio。PDB.PDBParser如下所示-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
parser=pdb parser(PERMISSIVE=True,QUIET=True)
data=parser . get _ structure( 2fat , pdb2fat.ent )
在这里,get_structure类似于MMCIFParser。PERMISSIVE选项试图尽可能灵活地解析蛋白质数据。
现在,使用下面给出的代码片段来检查结构及其类型
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
数据
打印(类型(数据))
好的,头结构存储字典信息。为此,请键入以下命令-
#文件名:example.py
#版权所有:2020,作者Lidihuo
#作者:www.lidihuo.com
#日期:2020年8月25日
print(data.header.keys())字典密钥([
名称,负责人,沉积日期,释放日期,结构方法,决议,
结构_参考,期刊_参考,作者,复合,来源,
关键词,期刊])
要获取名称,请使用以下代码-
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
print(data.header[name])
抗尿激酶型纤溶酶原激活物受体(upar)抗体:晶体
结构和结合表位
还可以使用以下代码检查日期和解决方案-
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
打印(数据。标题[发布日期])2006-11-14
打印(数据。标题[分辨率])1.77
2.物理数据库结构
物理数据库结构由包含两个链的单个模型组成。
L链,含残基数
H链,含残基数
每个残基由多个原子组成,每个原子都有一个由(x,y,z)坐标表示的三维(三维的缩写)位置。在以下部分中详细了解如何获得原子的结构-
2.1.模型
Structure.get_models()方法返回模型上的迭代器。它定义如下-
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
model=data.get_models()
模型
模型=列表(模型)
型号[]
类型(型号[0])
在此,模型精确地描述了一个三维(三维的缩写)构象。它包含一个或多个链。
2.2.链
Model.get_chain()方法返回链上的迭代器。它定义如下-
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
chains=list(models[0]).get_chains())
链
[, ]
类型(链[0])
在此,链描述了适当的多肽结构,即结合残基的连续序列。
2.3.残基
Chain.get _ residues()方法返回残基上的迭代器。它定义如下-
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
剩余=列表(链[0])。get _ residues())
len(残留物)
293
剩余1=列表(链[1])。get _ residues())
len(剩余1)
311
残基保留着属于氨基酸的原子。
2.4.原子
Residue.get_atom()返回原子上的迭代器,如下所示:
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
atoms=list(residue[0]).get_atoms())
原子
[, ]
原子拥有原子的三维(三维的缩写)坐标,称为向量。定义如下-
#文件名:示例. py
#版权所有:2020,作者李迪火
#作者:www.lidihuo.com
#日期:2020年8月25日
原子[0]。get_vector()
它表示x,y和z的坐标值。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。