主要内容

getpdb

从蛋白质数据库(PDB)数据库检索蛋白质结构数据

语法

PDB结构=getpdb(PDBid)
PDB结构=getpdb(PDBid……去整理的,ToFileValue, ...)
PDB结构=getpdb(PDBid……“SequenceOnly”,SequenceOnlyValue, ...)
PDB结构=getpdb(PDBid,…“超时”,超时值, ...)

输入参数

PDBid 为PDB数据库中的蛋白质结构记录指定唯一标识符的字符向量或字符串。

PDB数据库中的每个结构都由一个四个字符的字母数字标识符表示。例如4HbH是血红蛋白的标识符。

ToFileValue 指定用于保存PDB格式数据的文件名或路径和文件名的字符向量或字符串。如果仅指定文件名,则该文件将保存在MATLAB中®当前文件夹。

提示

将蛋白质结构记录保存到本地PDB格式的文件后,可以使用pdbread函数将文件脱机读入MATLAB软件或使用molviewer函数来显示和操作该结构的三维图像。

SequenceOnlyValue 只控制蛋白质序列的返回。的选择是真正的假的(默认)。

如果有一个序列,它将作为字符数组返回。如果有多个序列,它们将作为单元格数组返回。

超时值 以秒为单位的连接超时,指定为正标量。默认值为5。有关详细信息,请参阅在这里.

输出参数

PDB结构 包含每个PDB记录的字段的MATLAB结构。

描述

蛋白质数据库(PDB)是实验确定的三维生物大分子结构数据的存档。getpdb从包含三维生物大分子结构数据的蛋白质数据库(PDB)数据库检索蛋白质结构数据。

PDB结构=getpdb(PDBid)在PDB数据库中搜索标识符指定的蛋白质结构记录PDBid并返回MATLAB结构PDB结构,其中包含每个PDB记录的字段。下表总结了MATLAB结构中可能的PDB记录和相应字段PDB结构:

PDB数据库记录 MATLAB结构中的字段
标题 标题
障碍物 过时的
标题 标题
警告 警告
COMPND 复合
来源
KEYWDS 关键词
EXPDTA ExperimentData
作者 作者
REVDAT RevisionDate
斯普斯德 取代
JRNL 杂志
备注1 备注1
评论N

N等于2到999。

评论N

N等于2到999。

DBREF 数据库引用
SEQADV 顺序冲突
赛克斯 序列
FTNOTE 脚注
MODRES 修饰侧线
赫特 异源
赫特南 异源名
杂音 异源女性
制定 公式
螺旋线 螺旋线
转动 转动
SSBOND SSBond
链接 链接
海德 氢键
SLTBRG SaltBridge
CISPEP 顺肽
网站 网站
水晶1 Cryst1
ORIGXn 原创
SCALEn 规模
MTRIXn 矩阵
TVECT 平移向量
模型 模型
原子 原子
SIGATM AtomSD
ANISOU AnisotropicTemp
西吉 各向异性
终端
赫塔姆 HeterogenAtom
连接 连接

PDB结构=getpdb(PDBid, ...'属性名',财产价值, ...)电话getpdb使用属性名/属性值对的可选属性。您可以以任意顺序指定一个或多个属性。每一个属性名必须用单引号括起来,并且不区分大小写。这些属性名称/属性值对如下所示:

PDB结构=getpdb(PDBid……去整理的,ToFileValue, ...)将从数据库返回的数据保存为pdb格式的文件,ToFileValue.

提示

将蛋白质结构记录保存到本地PDB格式的文件后,可以使用pdbread函数将文件脱机读入MATLAB软件或使用molviewer函数来显示和操作该结构的三维图像。

PDB结构=getpdb(PDBid……“SequenceOnly”,SequenceOnlyValue, ...)仅控制蛋白质序列的返回。选择是真正的假的(默认)。如果有一个序列,它将作为字符数组返回。如果有多个序列,它们将作为单元格数组返回。

PDB结构=getpdb(PDBid,…“超时”,超时值, ...)设置从PDB数据库检索数据的连接超时(以秒为单位)。

序列字段

这个序列字段也是包含以下子字段中的序列信息的结构:

  • NumOfResidues

  • 链ID

  • 残留量—包含序列留数的三个字母代码。

  • 序列-包含序列剩余的单字母代码。

如果序列具有修改的残基,则残留量子字段可能不符合标准的三字母氨基酸代码。在这种情况下序列子字段将在与修改后的残数对应的位置包含修改后的残数代码。中提供了修改后的剩余代码修饰侧线领域

该模型领域

这个模型字段也是包含坐标信息的结构或结构数组。如果MATLAB结构包含一个模型,则模型字段是包含该模型坐标信息的结构。如果MATLAB结构包含多个模型,则模型字段是包含每个模型坐标信息的结构数组。这个模型字段包含以下子字段:

  • 原子

  • AtomSD

  • AnisotropicTemp

  • 各向异性

  • 终端

  • HeterogenAtom

原子场

这个原子字段也是包含以下子字段的结构数组:

  • 阿托姆塞诺

  • AtomName

  • altLoc

  • 重新命名

  • chainID

  • resSeq

  • 图标

  • X

  • Y

  • Z

  • 占用

  • 温度因子

  • 塞吉德

  • 要素

  • 指控

  • 原子结构-包含三个子字段:chemSymbol,remoteInd,分支.

例子

检索PDB标识符为的电子传输(血红素)蛋白质的结构信息5CYT,将信息读入MATLAB结构PDB结构,并将信息保存到PDB格式的文件中电子传输在MATLAB当前文件夹中。

pdbstruct=getpdb('5CYT','ToFile','electron_transport.pdb'))
之前介绍过的R2006a