主要内容

数据导入

从SAM、BAM、FASTA、FASTQ、GTF、GFF文件导入下一代测序(NGS)数据和特征注释

导入不同格式的NGS数据,如FASTA、FASTQ、SAM、BAM文件等。阅读GTF和GFF文件中的特性注释。使用各种对象访问和管理NGS数据。例如,BioIndexedFile对象允许您有效地访问具有大小不一的条目的文本文件,例如序列和注释。当源文件太大而无法放入内存时,使用该对象来访问单个条目或条目的子集。使用BioMapBioRead对象,用于存储和管理包含头、质量和对齐信息的序列读取数据。

功能

全部展开

fastainfo 返回关于FASTA文件的信息
fastaread 从FASTA文件读取数据
fastawrite 使用FASTA格式写入文件
fastqinfo 返回关于FASTQ文件的信息
fastqread 从FASTQ文件读取数据
fastqwrite 使用FASTQ格式写入文件
saminfo 返回关于SAM文件的信息
samsort 山姆排序文件
samread 从SAM文件读取数据
baminfo 返回关于BAM文件的信息
bamread 从BAM文件读取数据
bamsort BAM文件排序
bamindexread 读取BAM索引,BAI,文件

全部展开

BioRead 包含序列读取及其质量数据
BioMap 包含序列、质量、比对和映射数据
BioIndexedFile 允许快速和有效地访问大型文本文件与非统一大小的条目
GFFAnnotation 包含通用特性格式(GFF)注释
GTFAnnotation 包含GTF (Gene Transfer Format)注释
cuffgffread 过滤和转换GFF和GTF文件
cuffgtf2sam 将GTF文件转换为SAM文件

主题

使用下一代测序数据

使用BioIndexedFile对象来使用索引或键从大文件中提取条目,并使用自定义函数解析数据。

管理对象中的序列读取数据

使用BioMapBioRead对象访问和管理来自各种文件格式(如FASTQ、SAM和BAM文件)的下一代测序(NGS)数据。

在对象中存储和管理特性标注

使用GTF和GFF特征标注对象从一个或多个参考序列中检索特征信息。

数据格式及数据库

使用各种MATLAB访问在线数据库和存储库®函数并将数据导入工作区以进行进一步的分析。

使用基因组查看器应用可视化NGS数据

使用Genomics Viewer应用程序查看细胞色素p450基因单核苷酸变异的NGS比对数据。

特色的例子