从Genpept数据库中检索序列信息
数据
= getgenpept(Accessionnumber.
)
getgenpept(Accessionnumber.
)数据
= getgenpept(...,'partialseq',PartialSeqValue
,......)数据
= getgenpept(...,'tofile',ToFileValue
,......)数据
= getgenpept(…“FileFormat”,fileformatvalue.
,......)数据
= getgenpept(...,'sequencyonly',SequenceOnlyValue
,......)数据
= getgenpept(…超时,超时
,......)
Accessionnumber. |
指定序列记录的唯一字母数字标识符的字符矢量。 |
PartialSeqValue |
包含子序列的开始和结束位置的两元素整数数组[ 这指定了检索的子序列。StartAA 是1和EndAA ;EndAA 是一个整数StartAA 和序列的长度。 |
ToFileValue |
字符矢量指定文件名或路径和文件名以保存Genpept数据。如果仅指定文件名,则该文件将保存到MATLAB中®当前文件夹。 |
fileformatvalue. |
指定序列信息格式的字符向量。的选择是:
什么时候 |
SequenceOnlyValue |
控制仅将序列作为字符数组返回。选择是 |
超时 |
连接超时以秒为单位,指定为正标量。默认值为5.有关详细信息,请参阅在这里。 |
getgenpept
从Genpept数据库中检索蛋白质(氨基酸)序列信息,这是GenBank中的核苷酸序列的翻译®数据库并由国家生物技术信息中心(NCBI)维护。
笔记
NCBI已将其蛋白质搜索引擎的名称从Genpept改为Entrez蛋白质。但是,BioInformatics Toolbox™软件中的功能名称(getgenpept
和GenPeptread.
)表示仍在使用的genpep报告格式。有关GenPept数据的更多信息,请访问https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.。
搜索Genpept数据库中的登录号并返回数据
= getgenpept(Accessionnumber.
)数据
,包含序列信息的MATLAB结构。
小费
如果在检索Genpept格式的信息时发生错误,请尝试重新运行查询。由于与Genpept记录无关的因特网连接问题,可能会发生错误。
getgenpept(
在MATLAB命令窗口中显示信息,而不将数据返回到变量。显示的信息仅是用于搜索和检索数据的URL的超链接。Accessionnumber.
)
getgenpept(...,'
呼叫propertyname.
',适当的价值
,......)getgenpept
具有使用属性名称/属性值对的可选属性。您可以按任何顺序指定一个或多个属性。每个propertyname.
必须用单引号括起来,而是不论不敏感。这些属性名称/属性值对如下:
返回指定的子序列数据
= getgenpept(...,'partialseq',PartialSeqValue
,......)序列
领域的MATLAB结构。PartialSeqValue
是否包含子序列的起始和结束位置的两元素整数数组[
。StartAA
那EndAA
]StartAA
是1和EndAA
;EndAA
是一个整数StartAA
和序列的长度。
将从Genpept数据库返回的数据保存到文件。数据
= getgenpept(...,'tofile',ToFileValue
,......)ToFileValue
是一个字符向量,指定保存GenPept数据的文件名或路径和文件名。如果您只指定一个文件名,文件将被保存到MATLAB当前文件夹。该函数不向现有文件追加数据。相反,它会覆盖现有文件的内容而不发出警告。
小费
您可以使用GenPeptread.
功能。
以指定格式返回序列。选择是数据
= getgenpept(…“FileFormat”,fileformatvalue.
,......)“GenPept”
或'fasta'
。什么时候'fasta'
, 然后数据
只包含两个字段,标题
和序列
。“GenPept”
是默认的何时SequenceOnlyValue
是错误的
。'fasta'
是默认的何时SequenceOnlyValue
是真正的
。
仅返回序列数据
= getgenpept(...,'sequencyonly',SequenceOnlyValue
,......)数据
,一个字符阵列。选择是真正的
或错误的
(默认)。
笔记
如果你使用“SequenceOnly”
和'tofile'
属性在一起,输出始终是Fasta格式的文件。
设置连接超时以从Genpept数据库中检索数据。数据
= getgenpept(…超时,超时
,......)
检索人胰岛素受体的序列并将其存放在结构中,SEQ.
,在MATLAB命令窗口,输入:
Seq = getgenpept('AAA59174') Seq = LocusName: 'AAA59174' locussequencellength: '1382' LocusNumberofStrands: " locstopology: 'linear' LocusMoleculeType: " LocusGenBankDivision: 'PRI' LocusModificationDate: '06- 1 -1995' Definition: '胰岛素受体前体'登录:'AAA59174' Version: 'AAA59174.1' GI: '307070' Project: [] DBSource: 'locus HUMINSR登录M10051.1'关键词:" Source: 'Homo sapiens (human)' SourceOrganism: [4x65 char]参考:{[1x1 struct]}注释:[14x67 char]特征:[40x64 char]序列:[1x1382 char] SearchURL: [1x104 char] RetrieveURL: [1x92 char]
看着特征
结构的领域,可以确定Furin样重复域是234至281.只能从人胰岛素受体的序列中检索紫蛋白样重复域并将其存放在结构中,皮毛
,在MATLAB命令窗口,输入:
毛皮= getgenpept('aaa59174','partialseq',[234,281]);