主要内容

数据格式和数据库

生物信息学工具箱™ 允许您访问web上的许多数据库和其他在线数据存储库。它允许您将数据复制到MATLAB中®它还可以读取许多常见的基因组文件格式,这样你就不必编写和维护自己的文件阅读器。

基于Web的数据库-您可以直接访问Web上的公共数据库,并将序列和基因表达信息复制到MATLAB环境中。

当前支持的序列数据库是GenBank金宝app®(getgenbank),GenPept(格特根佩普),欧洲分子生物学实验室(EMBL)(getembl),以及蛋白质数据库(PDB)(getpdb)。您也可以使用单个功能访问NCBI基因表达综合(GEO)网站上的数据(getgeodata).

获得多重对齐序列(获取恶意信息),隐马尔可夫模型剖面图(gethmmprof),以及系统发育树数据(gethmmtree)来自PFAM数据库。

基因本体数据库-将数据库从Web加载到基因本体对象中(杰奈特).选择本体的各个部分以及geneont对象的方法(GetFounders(geneont),getdescendants (geneont),getmatrix (geneont),盖特亲属(吉农)),并使用实用程序函数操作数据(goannotread,结节).

从仪器中读取数据-读取基因测序仪器产生的数据(斯克雷德,joinseq,轨迹图),质谱仪(jcampread),安捷伦®芯片扫描仪(阿格费雷德).

读取数据格式-工具箱提供了许多从常见生物信息文件格式读取数据的函数。

写入数据格式-从Web获取数据的功能包括将数据保存到文件的选项。但是,有一个使用FASTA格式将数据写入文件的功能(法斯塔维特).

爆炸搜索-请求基于Web的BLAST搜索(blastncbi),从搜索中获取结果(getblast)并从以前保存的BLAST格式的报告文件中读取结果(爆破).

MATLAB环境内置了对其他行业标准文件格式的支持,包括金宝app微软®擅长®和逗号分隔值(CSV)文件。其他函数执行ASCII和低级二进制I/O,允许您开发用于任何数据格式的自定义函数。

相关的话题