生物信息学的工具箱
阅读,分析和可视化基因组和蛋白质组学数据
生物信息学工具箱™提供算法和应用程序的下一代测序(NGS),微阵列分析,质谱,和基因本体。使用工具箱功能,您可以从标准文件格式,如SAM, FASTA, CEL和CDF,以及在线数据库,如NCBI基因表达Omnibus和GenBank读取基因组和蛋白质组数据®.您可以使用序列浏览器、空间热图和集群图来探索和可视化这些数据。工具箱还提供了检测峰值、为缺失数据输入值和选择特征的统计技术。
您可以组合工具箱函数来支持常见的生物信息学工作流程。金宝app您可以使用芯片-SEQ数据来识别转录因子;分析RNA-SEQ数据以鉴定差异表达基因;在微阵列数据中识别副本数变体和SNP;并使用质谱数据对蛋白质分布进行分类。
学习更多关于计算生物学.
开始:
Bioinformatics工具箱提供用于下一代测序分析的算法和可视化技术。工具箱使您可以分析整个基因组,同时在基对分辨率的基础上执行计算。您可以使用NGS浏览器可视化和使用单端或配对结束短读取的短读取对齐方式。您还可以构建自定义分析程序,如以下示例所示。
可视化和调查短读对齐
使用NGS浏览器,您可以验证和研究短读序列的对准,以支持测量遗传变异和基因表达的分析。金宝appNGS浏览器让您:
- 可视化与核苷酸参考序列对齐的短读取数据
- 比较与公共参考序列对齐的多个数据集
- 查看参考序列的不同基部和地区的覆盖范围
- 调查对齐阅读的质量和其他细节
- 由于基本呼叫错误或多态性,识别不匹配
- 可视化插入和删除
- 检索相对于参考序列的特定区域的特征注释
存储和管理短读序列数据
下一代测序分析中使用的数据集通常太大,无法装入物理内存。生物信息学工具箱提供专门的数据容器,使您能够分析整个基因组。
的BioIndexedFile
对象允许您访问包含非均匀条目的文本文件的内容,例如序列,注释和交叉引用数据集。您可以从表,平面文件或特定于应用程序的格式生成这些对象,例如SAM,FASTA和FASTQ。
的Biomap.
类从短读序列存储信息,包括序列标题,读取序列,质量分数以及关于对齐和映射到单个参考序列的数据。您可以使用对象属性和方法来探索,访问,过滤和操作生物映射对象中包含的数据。
微阵列正常化
您可以使用几种方法规范化微阵列数据,包括Lowess,Global均值,绝对偏差(MAD)和定量标准化。您可以将这些方法应用于整个微阵列芯片或特定区域或块。过滤和归纳功能使您在运行分析和可视化例程之前清理原始数据。
数据分析与可视化
BioInformatics Toolbox允许您从Affymetrix执行后台调整并计算基因(探测器集)表达值®微阵列探测级数据使用鲁棒多阵列平均值(RMA)和GC鲁棒多阵列(GCRMA)程序。您可以将循环二进制分割应用于阵列CGH数据,并从微阵列实验中估计多假假假设测试的错误发现率。您还可以在两种不同的实验条件下对多个Affymetrix CEL文件或基因表达值进行探测强度进行排名不变集正常化。
用于可视化微阵列数据的专业例程包括微阵列的火山图,框图,逻辑图,I-R图和空间热图。您还可以使用G-BANDING模式可视化表表示。
使用例程从统计和机器学习工具箱™,您可以对结果进行分类,执行分层和k均值集群,并在统计可视化中表示您的微阵列数据,例如具有最佳叶排序,热图,原理组件图和分类树的2D群集图。
BioInformatics工具箱提供了一组用于质谱数据分析的功能。这些函数能够从Seldi,Maldi,LC / MS和GC / MS数据中预处理,分类和标记标识。预处理功能包括基线校正,平滑,校准和重采样。您可以使用M / Z轴对齐原始光谱数据,并在LC / MS和GC / MS数据上执行保留时间对齐。您可以同时绘制多个光谱。
您可以顺利,对齐和正常化光谱,然后使用分类和统计学习工具来创建分类器并识别潜在的生物标志物
图论和可视化
生物信息学工具箱使您能够将基本图论应用于稀疏矩阵。您可以创建、查看和操作图形,如交互图、层次图和路径。您可以确定和查看图中的最短路径,测试有向图中的循环,并发现两个图之间的同构。
统计学习和可视化
BioInformatics工具箱提供了在分类和统计学习算法上建立的功能统计和机器学习工具箱, 包括:
- 金宝app支持向量机(SVM)和k近邻分类器
- 建立交叉验证实验和测量不同分类方法的性能的功能
- 用于功能选择,映射和显示层次结构图和路径的交互式工具
基因本体论
BioInformatics工具箱使您可以从Matlab内访问基因本体数据库®,解析基因本体注释文件,并获得本体的子集,如祖先,后代或亲属。
序列对齐
该工具箱提供序列分析的功能,对象和方法,包括成对序列,序列配置文件和多个序列对齐。这些包括:
- 本地和全局序列对齐标准算法的MATLAB实现,例如Creferleman-Wunsch,Smith-Waterman和Profile隐藏的Markov Model算法
- 渐进式多序列对齐
- 对准结果矩阵的图形表示
- 标准得分矩阵,如PAM和BLOSUM矩阵族
- 序列一致性计算和序列标识显示
序列公用事业和统计
该工具箱允许您操作和分析序列,以获得对数据的更深层次的理解。您可以:
- 使用遗传密码将DNA或RNA序列转换为氨基酸序列
- 对序列进行统计分析,并在序列中搜索特定模式
- 施用限制酶和蛋白酶在序列中进行硅消化或产生随机序列进行测试用例
- 预测RNA序列的最小自由能二次结构
序列可视化
工具箱使您可以可视化序列和对齐。您可以查看使用Genbank功能注释的序列的线性或圆形贴图。您可以可视化RNA序列的次要结构图。交互式观众让您探索和修改成对和多个序列对齐。
系统发育树分析
该工具箱使您能够创建和编辑系统发育树。您可以使用诸如Jukes-Cantor、p-distance、alignment-score或用户定义的距离方法等广泛的相似性度量来计算对齐或未对齐的核苷酸或氨基酸序列之间的成对距离。系统发育树的构建采用层次链接技术,包括邻居连接、单链和完全链接以及非加权对组平均(UPGMA)等。
工具箱支持树的权重和重根金宝app、计算子树和计算树的规范形式。系统发生树查看器允许您修剪、重新排序和重命名分支;探索距离;读取或写入纽维克格式的文件。您还可以使用MATLAB中的注释工具来创建表示质量的树。
蛋白质特征分析
工具箱提供蛋白质序列分析技术,包括计算肽序列的性质如原子组成,等电点和分子量的例行程序。你可以确定蛋白质序列的氨基酸组成,用酶切割蛋白质,并创建PDB数据的主链图和Ramachandran图。您可以使用序列工具查看氨基酸序列的属性,或使用分子查看器显示和操作三维分子结构。
文件格式和数据库访问
您可以访问生物数据,在线数据库和网站的标准文件格式。BioInformatics工具箱使您可以:
- 从标准文件格式读取序列数据,包括Fasta,PDB和SCF
- 从Affymetrix的DAT, EXP, CEL, CHP和CDF文件格式读取微阵列数据;ImaGene®结果格式数据;安捷伦®特征提取软件文件;和GenePix®GPR和GAL文件
- 从在线数据库中读取数据,如Genbank,Embl,NCBI Blast和PDB
- 直接从NCBI基因表达式omnibus网站导入数据,单个命令
- 从NCBI IDECOOPS或UCSC Cytoband文本文件中读取细胞遗传学绑带信息
- 从MZXML和JCAMP-DX文件读取质谱数据
共享算法和部署应用程序
MATLAB提供的工具可以让您将数据分析程序转换为定制的软件应用程序。这些工具包括用于构建用户界面的开发工具、可视化集成开发环境和分析器。MATLAB应用程序部署产品允许您将MATLAB算法与现有的下载188bet金宝搏C、c++和Java™应用程序集成,将开发的算法和自定义接口部署为独立的应用程序,将MATLAB算法转换为Microsoft®可以从任何基于COM的应用程序访问的.NET或COM组件,并创建Microsoft Excel®插件。
您可以将MATLAB与常用的生物信息工具(如BioPerl,基于SOAP的Web服务和COM插件)集成。