Bioinformatics工具箱
ゲノムゲノムデータおよびプロテオミクスデータデータの,解析,および可致
Bioinformatics Toolbox™には,次世代シーケンサー(ngs),マイクロアレイマイクロアレイ,质载分类,遗伝子オントロジーオントロジーのアルゴリズムと의ツールさされてますます。ツールボックス关键词さいます。的なファイル形式,およびnCBI基因表达综合やGenBank®などなどデータとプロテオミクスデータををことができことができことができことができことができことができことができことができことができことができことができことができますマップことができことができを使て,をを使し,このこのを探索,可调することができ。ピークピーク検出,欠损データの値の,特点の选択のための统计ももももます。
ツールボックスの関数を組み合わせて,バイオインフォマティクスの一般的なワークフローに対応できます。ChIP-Seqデータを使用して,転写因子の特定,RNA-Seqデータの解析による発現変動遺伝子の特定,マイクロアレイデータにおけるコピー数多型とSNPの特定,質量分析データを使用したタンパク質プロファイルの分類を行うことができます。
情報生命科学の詳細については,こちらををください。
詳細を見る:
Bioinformatics工具箱では,次世代シーケンサーの解析ののと可化のを提供していますツールツールを使と,塩基対のの解像度でを実しながら解像で计算をしながら,ゲノム全実しながら,ゲノムゲノムををながらます.ngsブラウザーまたはペアエンドのをて,ショートリードアライメントを可使し调查できます。
ショートリードのアライメントの可化と调查
ngsブラウザーを使使使と,遗伝的変异と遗伝子発现测定する解析に対応し,ショートリードショートリード配列のアライメントを検证およびできngngますますででことができことができことができことができことができことができことができことができことができことができことができ
- ヌクレオチドヌクレオチドのリファレンス配列配列に整列されたショートリードデータ可以
- 普通のリファレンス配列と,整列された复ののセットを
- リファレンス配列のさまざまなな基と领域ののカバレッジ表示
- 整列整列されたたリードののやそのその他の详细を
- ベースコーリングのエラーまたは遺伝子多型による不一致を特定
- 挿入と削除を可視化
- リファレンス配列の特定領域に関連する特徴量の注釈を取得
ショートリードショートリード配列データのの保存保存と
次世代シーケンサーの解析で使用されるデータセットは,物理メモリに收まらないほど大きい场合がほとんどです.Bioinformatics工具箱には,ゲノム全体を解析できるようにする専用のデータコンテナーが用意されています。
生物indexedfile.
オブジェクトを使用すると,配列,注釈,データセットへの相互参照など,サイズが不均一なエントリを含むテキストファイルのコンテンツにアクセスできます。これらのオブジェクトは,テーブル,フラットファイル,または山姆,FASTA, FASTQなどのアプリケーション固有の形式から生成できます。
BioMap
クラスは,配列ヘッダー,リードリード,品牌スコア,単一のリファレンスのアライメントマッピングに关键词を含むショートリードから情情ますしますますます。含まれるデータの,アクセス,フィルタリング,操作业をます。
マイクロアレイマイクロアレイ正式化
マイクロアレイデータの正規化には,洛斯,グローバル平均,中央絶対偏差(疯狂),分位数の正規化など,いくつかの方法を使用できます。これらの方法は,マイクロアレイチップ全体または特定の領域やブロックに適用できます。フィルター処理関数や補完関数を使用すると,解析ルーチンと可視化ルーチンを実行する前に生データをクリーンアップできます。
データ解析と可視化
生物信息学工具箱では,ロバストマルチアレイ平台(RMA)およびgcロバストロバスト平衡(Gcrma)手法を使を使し,バックバックグラウンドでの调整をを実,youptmetrix®できます。复数のyefymetrix celファイルのプローブ强度,または2つの异なる実験から遗伝子発现値のいずれか,不锈钢正式规でするすることできます。
マイクロアレイデータを可視化するための専用ルーチンには、ボルケーノプロット、箱ひげ図、両対数プロット、I-R プロット、マイクロアレイの空間ヒートマップが含まれています。また、G 分染法のパターンを使用して、イデオグラムを可視化することもできます。
统计和机器学习工具箱™のルーチンを使使使,结果を分类し,阶层阶层とk-meanseクラスタリングを行し,最适なリーフの顺序2dクラスタグラム,ヒートヒート,主成の,分析类などの统计成プロットマイクロアレイデータマイクロアレイデータ表す表すます。
Bioinformatics Toolboxにに,送量分别データの解析ための一连关键词さの关键词てます。これらこれら有关部をてます。これらこれら有关部をてます。特殊を行ことができます。附属有关部に,ベースライン补正,平等化,キャリブレーション,リサンプリングが含まます.m / zが轴れます,生物のスペクトルデータ整列さ,lc /MSおよびGC / MSデータで保持保持できアライメント実できますます。
スペクトルの平滑化,整列,正規化を行い,分類および統計学習ツールを使用して分類器を作成し,バイオマーカーの候補を特定できます
グラフ理念と可催化
生物信息工具箱を使用すれば,基本的なグラフ理论をスパース行列に适用できます。交互作用マップ,阶层プロット,経路などのグラフを作成,表示,操作できます。グラフの最短経路を决定して表示し,有向グラフのサイクルをテストて,2つのグラフ间の同型を见つけるます。
統計学習と可視化
Bioinformatics工具箱にに,以下のとおり,统计和机器学习工具箱の分類および統計学習アルゴリズムに基づいて構築される関数が用意されています。
- サポートベクターマシン(SVM)とK最近最近法の分量器
- 交差検证実験を设定设定て,さまざまな分享方法のパフォーマンスを测定するための关联
- 特价のの,マッピング,阶层プロットと経路ののための対话型ツール
遗伝子オントロジー
生物信息工具箱を使用すれば,MATLAB®内から遺伝子オントロジーのデータベースにアクセスして,遺伝子オントロジーの注釈が付けられたファイルを解析し,先祖,子孫,親戚などのオントロジーのサブセットを取得できます。
配列アライメント
ツールボックスには,ペアワイズ配列,配列プロファイル,多重配列アライメントなど,配列解析のための関数,オブジェクト,メソッドが用意されています。以下はその例です。
- ,均为Needleman-Wunschプロファイル隠れマルコフモデルのアルゴリズムなど,MATLABでの局所的および大局的な配列アライメントの標準的なアルゴリズムの実装
- 累进法による多重配列アライメント
- 整列結果の行列のグラフによる表現
- Pamおよびblosum行程族などの标准的な行
- コンセンサス配列の計算と配列ロゴの表示
配列のユーティリティと統計
ツールボックス操をて,配列を操をてし,さらにさらに详しくデータををでき。
- 遺伝暗号を使用して,DNA配列またはRNA配列をアミノ酸配列に変換
- 配列の統計解析を実行し,配列内の特定のパターンを検索
- 制限酵素とプロテアーゼを適用して,コンピューターによる配列の消化を実行するか,テストケースのランダム配列を作成
- RNA配列配列の小小自然エネルギーののの2次构造を予测
配列の可催化
ツールボックスを使使使,配列とアライメントを可化でき.genbank机构で注釈がられた,配列の形または円形マップできますrののののののの型の可以化。をを使と,対配列アライメントと多重配列アライメント探索し,変更できます。
系統樹解析
ツールボックスを使使使すれ,系统系统を作物してできます.jukes-cantor,p距离,アライメントスコア,ユーザー定义の距离など,幅広い幅広い性指标使し,整列整列さた,整列整列たてていないヌクレオチド配列やアミノ酸配列対系统を计算できできでき系统计算できます系统计算はできできできでき计算できできできできできできできできできできできできできできできできできできできでき完全连结连结连结连结连结连结とと完全连结连结,酸とと完全连结连结,重重结结使などなどなど结结などなどなどなどのさまざまななななどのさまざまさまざまななによるによるののさまざまななによる的阶层のさまざまさまざまな使による的阶层のさまざまさまざま使使的的阶层のさまざまさまざま使用して构筑されます。
ツールボックスは,木の重み付けと根の変更,部分木の計算,木の正規形の計算に対応しています。系統樹ビューアーでは,枝の削除,並べ替え,名前の変更のほか,距離の探索,Newick形式のファイルの読み取りまたは書き込みを行うことができます。MATLABの注釈ツールを使用して,プレゼンテーションレベルの系統樹を作成することもできます。
タンパク質の特徴量解析
ツールボックスでは,原子組成,等電点,分子量などのペプチド配列のプロパティを計算するルーチンを含む,タンパク質配列の解析手法を提供しています。タンパク質配列のアミノ酸組成を決定して,酵素でタンパク質を切断し,PDBデータのバックボーンプロットとラマチャンドランプロットを作成できます。序列的工具を使用して,アミノ酸配列のプロパティを表示したり,分子观众を使用して3 d分子構造を表示および操作したりできます。
ファイル形式とデータベースアクセス
生物学的データ,オンラインデータベース,およびWebサイトの標準的なファイル形式にアクセスできます。生物信息工具箱を使用すると,以下を行うことができます。
- Fasta,PDB,SCFなどの标准的な形式からから配列配列データを
- Affymetrix DAT,EXP,CEL,CHP,CDFファイルなどのファイル,Imagene®结果结果形式の,安捷伦®特征提取软件ファイル,genepix®GPRおよびgalファイルファイルからマイクロアレイを読み取る
- 基因库,EMBL NCBI BLAST, PDBなどのオンラインデータベースからデータを読み取る
- 単一のコマンドで,NCBI基因表达综合の网サイトから直接データを読み込む
- ncbiイデオグラムまたはucscサイトバンドテキストファイルから细胞遗伝バンディングバンディング情情ファイルを
- MZXMLファイルとjcamp-dxファイルから质质质质読み取る
アルゴリズムの共有とアプリケーションの配布
MATLABには,データ解析プログラムをカスタマイズされたソフトウェアアプリケーションに変換するためのツールが用意されています。これらには,ユーザーインターフェイスを構築するための開発ツール,視覚的な統合開発環境,プロファイラーが含まれています。马铃薯アプリケーション配布製品を使用すれば、MATLAB アルゴリズムを既存の C、C++、Java™ アプリケーションに統合し、開発したアルゴリズムとカスタム インターフェイスをスタンドアロン アプリケーションとして配布し、MATLAB アルゴリズムを Microsoft®.NETまたはCOMコンポーネントに変换できますこれらには,comベースのアプリケーションからアクセスことができことができことができ,微软excel®アドインを作成できます。
Bioperl,Soapベースの网页サービス,comプラグインなどの一流的にされるバイオツールと,matlabををできます。