主要内容

gethmmprof

检索隐马尔可夫模型(HMM)从数据库包含配置文件

语法

HMMStruct= gethmmprof (PFAMName)
HMMStruct= gethmmprof (PFAMNumber)
HMMStruct= gethmmprof (…,去整理,ToFileValue,……)
HMMStruct= gethmmprof (…“模式”,ModeValue,……)
HMMStruct= gethmmprof (…“超时”,TimeOutValue,……)

输入参数

PFAMName 特征向量指定一个蛋白质的姓(唯一标识符)包含了一个嗯剖面记录的数据库。例如,“7 tm_2”
PFAMNumber 整数指定一个蛋白家族中的一个嗯概要记录数量包含了数据库。例如,2蛋白家族蛋白家族数量吗“PF00002”
ToFileValue 特征向量指定一个文件名或路径和文件名保存数据。如果你仅指定一个文件名,文件将被保存在MATLAB®当前文件夹。
ModeValue

特征向量指定返回的对齐方式。的选择是:

  • “ls”——默认。全局比对模式。

  • “fs”——局部比对模式。

TimeOutValue 在几秒钟内连接超时,指定为一个积极的标量。默认值是5。有关详细信息,请参见在这里

输出参数

HMMStruct MATLAB嗯剖面的结构包含信息从包含检索数据库。

描述

请注意

gethmmprof从PFAM-HMM检索信息概要文件,从文件格式版本HMMER2.0 HMMER3 / f。

HMMStruct= gethmmprof (PFAMName)搜索包含了数据库记录由(http://pfam.xfam.org/)PFAMName(一种蛋白质的姓),检索嗯配置信息,并将其存储在HMMStruct,MATLAB结构包含以下字段对应参数的嗯。

描述
的名字 蛋白质的姓(唯一标识符)嗯概要文件包含数据库中的记录。
PfamAccessionNumber 加入蛋白质家族的HMM概要文件包含数据库中的记录。
ModelDescription 嗯概要的描述。
ModelLength 这个概要文件的长度(数量的匹配状态)。
字母 模型中使用的字母,“AA”“NT”

请注意

AlphaLength是20“AA”和4“NT”

MatchEmission

在比赛中象征发射概率。

的格式是一个矩阵的大小ModelLength——- - - - - -AlphaLength,每一行对应于特定的排放分布匹配状态。

InsertEmission

象征发射概率处于插入状态。

的格式是一个矩阵的大小ModelLength——- - - - - -AlphaLength,每一行对应于特定的排放分布插入状态。

NullEmission

象征在比赛中发射概率和插入状态为零模型。

是一个1——格式AlphaLength行向量。

请注意

零概率也被称为背景概率。

BeginX

开始状态转换概率。

格式是1 -(ModelLength + 1)行向量:

(B - > D1 - > M1 - > M2 B - > M3 ....B - >修复)
MatchX

匹配状态转移概率。

是一个4×——格式(ModelLength - 1)矩阵:

(M1 - > M2 M2 - > M3……M [end-1] - >修补;M1 - > I1 M2 - > I2……M [end-1] - > [end-1];M1 - > D2 M2 - > D3……M [end-1] - > Dend;M1 - > E M2 - > E……M [end-1] - > E]
InsertX

插入状态转移概率。

是一个2——格式(ModelLength - 1)矩阵:

(I1和I2 - > - > M2 M3……我[end-1] - >修补;I1和I2 - > - > I1 I2……我[end-1] - > [end-1]]
DeleteX

删除状态转移概率。

是一个2——格式(ModelLength - 1)矩阵:

(D1 - > M2 D2 - > M3……D [end-1] - >修补;D1 - > D2 D2 - > D3……D [end-1] - > Dend]
FlankingInsertX

侧面插入状态(N和C)用于当地概要对齐。

格式是一个2×2矩阵:

[N - > B C - > T;N - > N C - > C]
LoopX

循环状态转换概率用于多个对齐。

格式是一个2×2矩阵:

[E - > C J - > B;E - > J J - > J]
NullX

零过渡概率用于提供与log-odds分数值状态转换。

格式是一个2×1列向量:

F (G - >;G - > G)

HMMStruct= gethmmprof (PFAMNumber)决定了蛋白质家族加入数量PFAMNumber(整数),搜索的数据库包含了相关记录,档案信息,并将其存储在检索嗯HMMStructMATLAB结构。

HMMStruct= gethmmprof (…”,PropertyName”,PropertyValue,……)调用gethmmprof与使用属性名可选属性/属性值对。您可以指定一个或多个属性在任何顺序。每一个PropertyName必须包含在单引号,不分大小写。这些属性名称/属性值对如下:

HMMStruct= gethmmprof (…,去整理,ToFileValue,……)将从包含数据库返回的数据保存在一个文件规定ToFileValue

请注意

你可以阅读一个HMM-formatted文件回MATLAB软件使用pfamhmmread函数。

HMMStruct= gethmmprof (…“模式”,ModeValue,……)指定返回的对齐方式。的选择是:

  • “ls”(默认)——全球定位模式。

  • “fs”——局部比对模式。

嗯剖面模型的更多信息,请参阅嗯剖面模型

HMMStruct= gethmmprof (…“超时”,TimeOutValue,……)设置连接超时(秒)包含了数据库检索数据。

例子

检索一个隐马尔科夫模型(HMM)概要文件的全局比对7-transmembrane受体蛋白质分泌素家族,输入:

嗯= gethmmprof (7 tm_2)嗯=结构体字段:名称:“7 tm_2”PfamAccessionNumber:“PF00002.21”ModelDescription: 7跨膜受体(分泌素家族)的ModelLength: 241字母:“AA”MatchEmission:[241×20双]InsertEmission:[241×20双]NullEmission:[1×20双]BeginX:[242×1双]MatchX:[240×4双]InsertX:[240×2双]DeleteX:[240×2双]FlankingInsertX:[2×2双]LoopX:[2×2双]NullX:(2×1双)
之前介绍过的R2006a