生物信息学工具箱™ 允许您访问web上的许多数据库和其他在线数据存储库。它允许您将数据复制到MATLAB中®它还可以读取许多常见的基因组文件格式,这样你就不必编写和维护自己的文件阅读器。
基于Web的数据库-您可以直接访问Web上的公共数据库,并将序列和基因表达信息复制到MATLAB环境中。
当前支持的序列数据库是GenBank金宝app®(getgenbank
),GenPept(格特根佩普
),欧洲分子生物学实验室(EMBL)(getembl
),以及蛋白质数据库(PDB)(getpdb
)。您也可以使用单个功能访问NCBI基因表达综合(GEO)网站上的数据(getgeodata
).
获得多重对齐序列(获取恶意信息
),隐马尔可夫模型剖面图(gethmmprof
),以及系统发育树数据(gethmmtree
)来自PFAM数据库。
基因本体数据库-将数据库从Web加载到基因本体对象中(杰奈特
).选择本体的各个部分以及geneont对象的方法(GetFounders(geneont)
,getdescendants (geneont)
,getmatrix (geneont)
,盖特亲属(吉农)
),并使用实用程序函数操作数据(goannotread
,结节
).
从仪器中读取数据-读取基因测序仪器产生的数据(斯克雷德
,joinseq
,轨迹图
),质谱仪(jcampread
),安捷伦®芯片扫描仪(阿格费雷德
).
读取数据格式-工具箱提供了许多从常见生物信息文件格式读取数据的函数。
序列数据:GenBank(genbankread
),GenPept(genpeptread
),EMBL(emblread
), PDB (pdbread
),和法斯塔(禁区
)
多重对齐序列:ClustalW和GCG格式(多重对齐读取
)
来自微阵列的基因表达数据:基因表达综合(GEO)数据(地学软件
),GenePix®GPR和GAL文件中的数据(gprread
,戈雷德
),SPOT数据(sptread
),Affymetrix®基因芯片®资料(受惊
),和ImaGene®结果文件(成像头
)
隐马尔可夫模型配置文件:PFAM-HMM文件(pfamhmmread
)
写入数据格式-从Web获取数据的功能包括将数据保存到文件的选项。但是,有一个使用FASTA格式将数据写入文件的功能(法斯塔维特
).
爆炸搜索-请求基于Web的BLAST搜索(blastncbi
),从搜索中获取结果(getblast
)并从以前保存的BLAST格式的报告文件中读取结果(爆破
).
MATLAB环境内置了对其他行业标准文件格式的支持,包括金宝app微软®擅长®和逗号分隔值(CSV)文件。其他函数执行ASCII和低级二进制I/O,允许您开发用于任何数据格式的自定义函数。