从蛋白质数据库(PDB)数据库检索蛋白质结构数据
PDB结构
=getpdb(PDBid
)PDB结构
=getpdb(PDBid
……去整理的,ToFileValue
, ...)PDB结构
=getpdb(PDBid
……“SequenceOnly”,SequenceOnlyValue
, ...)PDB结构
=getpdb(PDBid
,…“超时”,超时值
, ...)
PDBid |
为PDB数据库中的蛋白质结构记录指定唯一标识符的字符向量或字符串。 注 PDB数据库中的每个结构都由一个四个字符的字母数字标识符表示。例如 |
ToFileValue |
指定用于保存PDB格式数据的文件名或路径和文件名的字符向量或字符串。如果仅指定文件名,则该文件将保存在MATLAB中®当前文件夹。 |
SequenceOnlyValue |
只控制蛋白质序列的返回。的选择是真正的 或假的 (默认)。如果有一个序列,它将作为字符数组返回。如果有多个序列,它们将作为单元格数组返回。 |
超时值 |
以秒为单位的连接超时,指定为正标量。默认值为5。有关详细信息,请参阅在这里. |
PDB结构 |
包含每个PDB记录的字段的MATLAB结构。 |
蛋白质数据库(PDB)是实验确定的三维生物大分子结构数据的存档。getpdb
从包含三维生物大分子结构数据的蛋白质数据库(PDB)数据库检索蛋白质结构数据。
在PDB数据库中搜索标识符指定的蛋白质结构记录PDB结构
=getpdb(PDBid
)PDBid
并返回MATLAB结构PDB结构
,其中包含每个PDB记录的字段。下表总结了MATLAB结构中可能的PDB记录和相应字段PDB结构
:
PDB数据库记录 | MATLAB结构中的字段 |
---|---|
标题 |
标题 |
障碍物 |
过时的 |
标题 |
标题 |
警告 |
警告 |
COMPND |
复合 |
来源 |
源 |
KEYWDS |
关键词 |
EXPDTA |
ExperimentData |
作者 |
作者 |
REVDAT |
RevisionDate |
斯普斯德 |
取代 |
JRNL |
杂志 |
备注1 |
备注1 |
评论N
注 N等于2到999。 |
评论N
注 N等于2到999。 |
DBREF |
数据库引用 |
SEQADV |
顺序冲突 |
赛克斯 |
序列 |
FTNOTE |
脚注 |
MODRES |
修饰侧线 |
赫特 |
异源 |
赫特南 |
异源名 |
杂音 |
异源女性 |
制定 |
公式 |
螺旋线 |
螺旋线 |
表 |
表 |
转动 |
转动 |
SSBOND |
SSBond |
链接 |
链接 |
海德 |
氢键 |
SLTBRG |
SaltBridge |
CISPEP |
顺肽 |
网站 |
网站 |
水晶1 |
Cryst1 |
ORIGXn |
原创 |
SCALEn |
规模 |
MTRIXn |
矩阵 |
TVECT |
平移向量 |
模型 |
模型 |
原子 |
原子 |
SIGATM |
AtomSD |
ANISOU |
AnisotropicTemp |
西吉 |
各向异性 |
特 |
终端 |
赫塔姆 |
HeterogenAtom |
连接 |
连接 |
电话PDB结构
=getpdb(PDBid
, ...'属性名
',财产价值
, ...)getpdb
使用属性名/属性值对的可选属性。您可以以任意顺序指定一个或多个属性。每一个属性名
必须用单引号括起来,并且不区分大小写。这些属性名称/属性值对如下所示:
将从数据库返回的数据保存为pdb格式的文件,PDB结构
=getpdb(PDBid
……去整理的,ToFileValue
, ...)ToFileValue
.
仅控制蛋白质序列的返回。选择是PDB结构
=getpdb(PDBid
……“SequenceOnly”,SequenceOnlyValue
, ...)真正的
或假的
(默认)。如果有一个序列,它将作为字符数组返回。如果有多个序列,它们将作为单元格数组返回。
设置从PDB数据库检索数据的连接超时(以秒为单位)。PDB结构
=getpdb(PDBid
,…“超时”,超时值
, ...)
这个序列
字段也是包含以下子字段中的序列信息的结构:
NumOfResidues
链ID
残留量
—包含序列留数的三个字母代码。
序列
-包含序列剩余的单字母代码。
注
如果序列具有修改的残基,则残留量
子字段可能不符合标准的三字母氨基酸代码。在这种情况下序列
子字段将在与修改后的残数对应的位置包含修改后的残数代码。中提供了修改后的剩余代码修饰侧线
领域
这个模型
字段也是包含坐标信息的结构或结构数组。如果MATLAB结构包含一个模型,则模型
字段是包含该模型坐标信息的结构。如果MATLAB结构包含多个模型,则模型
字段是包含每个模型坐标信息的结构数组。这个模型
字段包含以下子字段:
原子
AtomSD
AnisotropicTemp
各向异性
终端
HeterogenAtom
这个原子
字段也是包含以下子字段的结构数组:
阿托姆塞诺
AtomName
altLoc
重新命名
chainID
resSeq
图标
X
Y
Z
占用
温度因子
塞吉德
要素
指控
原子结构
-包含三个子字段:chemSymbol
,remoteInd
,分支
.
检索PDB标识符为的电子传输(血红素)蛋白质的结构信息5CYT
,将信息读入MATLAB结构PDB结构
,并将信息保存到PDB格式的文件中电子传输
在MATLAB当前文件夹中。
pdbstruct=getpdb('5CYT','ToFile','electron_transport.pdb'))