检索隐马尔可夫模型(HMM)从数据库包含配置文件
HMMStruct
= gethmmprof (PFAMName
)HMMStruct
= gethmmprof (PFAMNumber
)HMMStruct
= gethmmprof (…,去整理,ToFileValue
,……)HMMStruct
= gethmmprof (…“模式”,ModeValue
,……)HMMStruct
= gethmmprof (…“超时”,TimeOutValue
,……)
PFAMName |
特征向量指定一个蛋白质的姓(唯一标识符)包含了一个嗯剖面记录的数据库。例如,“7 tm_2” 。 |
PFAMNumber |
整数指定一个蛋白家族中的一个嗯概要记录数量包含了数据库。例如,2 蛋白家族蛋白家族数量吗“PF00002” 。 |
ToFileValue |
特征向量指定一个文件名或路径和文件名保存数据。如果你仅指定一个文件名,文件将被保存在MATLAB®当前文件夹。 |
ModeValue |
特征向量指定返回的对齐方式。的选择是:
|
TimeOutValue |
在几秒钟内连接超时,指定为一个积极的标量。默认值是5。有关详细信息,请参见在这里。 |
HMMStruct |
MATLAB嗯剖面的结构包含信息从包含检索数据库。 |
请注意
gethmmprof
从PFAM-HMM检索信息概要文件,从文件格式版本HMMER2.0 HMMER3 / f。
搜索包含了数据库记录由(http://pfam.xfam.org/)HMMStruct
= gethmmprof (PFAMName
)PFAMName
(一种蛋白质的姓),检索嗯配置信息,并将其存储在HMMStruct
,MATLAB结构包含以下字段对应参数的嗯。
场 | 描述 |
---|---|
的名字 |
蛋白质的姓(唯一标识符)嗯概要文件包含数据库中的记录。 |
PfamAccessionNumber |
加入蛋白质家族的HMM概要文件包含数据库中的记录。 |
ModelDescription |
嗯概要的描述。 |
ModelLength |
这个概要文件的长度(数量的匹配状态)。 |
字母 |
模型中使用的字母,“AA” 或“NT” 。请注意
|
MatchEmission |
在比赛中象征发射概率。 的格式是一个矩阵的大小 |
InsertEmission |
象征发射概率处于插入状态。 的格式是一个矩阵的大小 |
NullEmission |
象征在比赛中发射概率和插入状态为零模型。 是一个1——格式 请注意 零概率也被称为背景概率。 |
BeginX |
开始状态转换概率。 格式是1 - (B - > D1 - > M1 - > M2 B - > M3 ....B - >修复) |
MatchX |
匹配状态转移概率。 是一个4×——格式 (M1 - > M2 M2 - > M3……M [end-1] - >修补;M1 - > I1 M2 - > I2……M [end-1] - > [end-1];M1 - > D2 M2 - > D3……M [end-1] - > Dend;M1 - > E M2 - > E……M [end-1] - > E] |
InsertX |
插入状态转移概率。 是一个2——格式 (I1和I2 - > - > M2 M3……我[end-1] - >修补;I1和I2 - > - > I1 I2……我[end-1] - > [end-1]] |
DeleteX |
删除状态转移概率。 是一个2——格式 (D1 - > M2 D2 - > M3……D [end-1] - >修补;D1 - > D2 D2 - > D3……D [end-1] - > Dend] |
FlankingInsertX |
侧面插入状态(N和C)用于当地概要对齐。 格式是一个2×2矩阵: [N - > B C - > T;N - > N C - > C] |
LoopX |
循环状态转换概率用于多个对齐。 格式是一个2×2矩阵: [E - > C J - > B;E - > J J - > J] |
NullX |
零过渡概率用于提供与log-odds分数值状态转换。 格式是一个2×1列向量: F (G - >;G - > G) |
决定了蛋白质家族加入数量HMMStruct
= gethmmprof (PFAMNumber
)PFAMNumber
(整数),搜索的数据库包含了相关记录,档案信息,并将其存储在检索嗯HMMStruct
MATLAB结构。
调用HMMStruct
= gethmmprof (…”,PropertyName
”,PropertyValue
,……)gethmmprof
与使用属性名可选属性/属性值对。您可以指定一个或多个属性在任何顺序。每一个PropertyName
必须包含在单引号,不分大小写。这些属性名称/属性值对如下:
将从包含数据库返回的数据保存在一个文件规定HMMStruct
= gethmmprof (…,去整理,ToFileValue
,……)ToFileValue
。
请注意
你可以阅读一个HMM-formatted文件回MATLAB软件使用pfamhmmread
函数。
指定返回的对齐方式。的选择是:HMMStruct
= gethmmprof (…“模式”,ModeValue
,……)
“ls”
(默认)——全球定位模式。
“fs”
——局部比对模式。
嗯剖面模型的更多信息,请参阅嗯剖面模型。
设置连接超时(秒)包含了数据库检索数据。HMMStruct
= gethmmprof (…“超时”,TimeOutValue
,……)
检索一个隐马尔科夫模型(HMM)概要文件的全局比对7-transmembrane受体蛋白质分泌素家族,输入:
嗯= gethmmprof (7 tm_2)嗯=结构体字段:名称:“7 tm_2”PfamAccessionNumber:“PF00002.21”ModelDescription: 7跨膜受体(分泌素家族)的ModelLength: 241字母:“AA”MatchEmission:[241×20双]InsertEmission:[241×20双]NullEmission:[1×20双]BeginX:[242×1双]MatchX:[240×4双]InsertX:[240×2双]DeleteX:[240×2双]FlankingInsertX:[2×2双]LoopX:[2×2双]NullX:(2×1双)