主要内容

このページの翻訳は最新ではありません。ここをクリックして,英语の最新版を参照してください。

癌の検出

00

はじめに

プロファイルはの标ますますますますますますますます,西尔西(表面増强レーザー脱/イオン化ことができはは,Seldi(表面表面レーザー着/イオン。。この技术には,悪性悪性定理学におけるにおける临床诊断诊断テストを能能能性がありありありありありありあり

問題:癌の検出

目标は,质载分子データから患者と対照患者区别できる癌患者

この例では,分享器による癌患者と患者の区别使使値値な测定値,つまり“特徴”を选択するするををししし。のイオン强度レベルです。

データデータ书架设定

この例で使用されるデータは,ファイルovariar_dataset.mat.「fda-nci临床プロテオミクスプログラム」」」」」バンク提供されていいいい提供セットのについてについてははます提供提供のについてについてははますデータ提供セットのについてはは提供提供提供セットさについてについてはは提供提供提供のについてについては

使用顺序和并行计算的光谱批处理(生物信息学工具箱)の手顺に従っ,データファイルOvarianCancerQAQCdataset.matを作成します。新しいファイルには,変数yMZ,およびGRP.が含まれています。

yの各列は,患者から得られた測定値を表します。yには216人の患者を表す216の列があり,そのうち121.人は卵巣癌患者で95.人は正常な患者です。

yの各行は,MZに示す特定の質量/充填量値でのイオン強度レベルを表します。MZには15000个の销量/充填値ありあり,yの各行は特价ののイオン强度强度レベルレベルの强度强度レベル表します。

変数GRP.は,これらのどの標本が癌患者を表し,どの標本が正常な患者を表すかを示すインデックス情報を保持します。

主な特价のランク付け

このタスクは,特点の数号観测値をにもかかわらず,1つの特征で问题そのため,目标は,复数の特征の重み付けを行同过れれたをないされれたないないされをですさささ。

重要な特价を见つける简介な方法は,m / zの各値が独立としし,2群t検定の计算行。randfeatures.は,最も重要なM / Z値のインデックスを返します。たとえば,検定統計量の絶対値によってランク付けされた100個のインデックスを返します。

OvarianCancerQAQCdataset.matを読み込んで,randfeatures.(生物信息学工具箱)を使用して特徴をランク付けし,入力Xとして上游100の测定値を选択します。

印第安纳州= rankfeatures (Y, grp,'标准'的tt'numberofindices', 100);: x = Y(印第安纳州);

2つのクラスのターゲットT.を以下のように定義します。

双(t = strcmp ('癌症',GRP));t = [t;1-T];

スクリプトの前処理手順と上記の例は,前処理および特徴選択の想定される代表的な手順を示すためのものです。異なる手順またはパラメーターを使用すると,異なる結果が得られたり,結果が改善されたりする場合があります。

[x,t] = ovariar_dataset;谁是XT.
名称大小字节类属性t 2x216 3456双x 100x216 172800 double

X内の各列は,216人の异なる患者1人を表します。

X100年の各行は,各患者の個の特定の質量/充填量値でのイオン強度レベルを表します。

変数T.216年には2行から成る個の値があり,それぞれの値は癌患者を示す(1,0),または正常な患者を示す[0,1]のいずれかになっています。

フィードフォワードニューラルネットワークを使使した分享



ニューラルニューラルネットワークはランダムなな重み重みで初されるため结果は例を実実この结果は少异なりなりこの结果ような异なりをこのこのななランダムなりを回避このにはランダム性をを回避结果结果はランダムなりををするにははは性性ををににはただし,乱数シード设定は独独独独のアプリケーションに独独独。

setdemorandstream (672880951)

5つの隠れ层ニューロンある1つの隠れ层のフィードフォワードニューラルネットワーク作物,学校习行。入力标本および标标,検证,,セット,およびテストににさます。学校习。

。

网= patternnet (5);视图(净)

これでネットワークの学习の准备が整いました。标本が学习セット,検证セット,およびテストセットに自动的に分割されます。学习セットは,ネットワークに教えるために使用されます。検证セットに対してネットワークの改善がが続いて限制,学校が続行さますますでこと,ネットワークの精密度を独立し测定でき

神经网络训练工具をを用すると,学校するすると,学校に使使されているアルゴリズムアルゴリズムいるいるいるれれれれ状态习が表示され习の状态が表示され条件绿を停止したた绿で强调强调表示されれ绿で强调强调表示されれ。

下载にあるボタンを使と,便利なプロットを开放ことができます。これらのプロットは,学校中间学院习后およびことができことができますのリンクおよびおよびの邻のリンク使とと,これらににを开启ことができます。

(净,tr) =火车(净,x, t);

学習中にネットワーク性能がどのように改善されているかを確認するには,学習ツールの(性能)ボタンをクリックするか,関数plotperform.を使用します。

これは,ネットワークスケール,対,スケール,スケールが进む急激,ネットワーク,スケール表示进む。

性能は,学校セット,検证セット,およびテストセットのそれぞれ表示れます。

PlotPerform(TR)

メインメインセットからからした标标を使て,学校済み済みネットワークをできるようはなりましたたようデータ习にまったくた。セットとなります。これにより,実际のデータでテストした场合にネットワークがどの程度の性能かを推定できます。

ネットワークのの力は0〜1の范囲にます。癌癌患者を示す示すまたはまたは常な患者を示すが得られるように出出のしきい値を设定ししししきいを设定设定し

testx = x(:,tr.testind);testt = t(:,tr.testind);testy = net(testx);testclasses = yesty> 0.5
testclasses =.2x32逻辑阵列0 1 1 0 1 1 11 11 11 11 1 1 1 1 11 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 1 1 1 1 1 1 1 1 1 1

ニューラルニューラルあてはどのどの度する度にあてはまるかまるか测定するののつははははははははははははは

混同行列は,正しい分類と正しくない分類の比率を示します。正しい分類は,行列の対角部分の緑の正方形に表示されます。赤い正方形は,正しくない分類を表します。

ネットワークネットワーク正确な综合,赤い正方形の比率小さく,误分享がほとんどないこと示します。

ネットワークが正当でないでない合书,より长时间の学校を行か,隠れニューロンを増やしネットワークネットワーク习を试すます。

plotconfusion(Testt,Testy)

正面分享と正しくないをの全ますををに示します。

[c,cm] =混乱(testt,睾丸);fprintf('百分比正确分类:%f %% \ n', 100 * (1 - c));
百分比正确分类:90.625000%
fprintf('百分比分类错误:%f%%\n', 100 * c);
错误分类:9.375000%

ニューラルネットワークがどの程度データあてはあてはまるか测定するもうもうつのあてはは,受信,动作特性プロットプロットこのプロット,出力のしきいが0〜1の范囲変変するするにに伪性率とと阳台率にどのような关键词ががあるかを示し示し

线が左上にばあるほど,高い真阳性率得るために受け入れる必要が伪性性性が减少ししなな性とはします。近くに向かって伸びてててててです

クラス1は癌患者,クラス2は正常な患者を示します。

plotroc (testT暴躁的)

この例では,ニューラルネットワークを癌の検出用分類器として使用する方法を説明しました。分類器の性能を向上させるために,主成分分析などの手法を使用して,ニューラルネットワークの学習に使用されるデータの次元を減らすこともできます。

参考文献

[1] T.P.Conrads等人,“卵巢检测的高分辨率血清蛋白质组织特征”,内分泌相关癌症,11,2004,PP。163-178。

[2] E.F. Petricoin等人,“使用血清中的蛋白质组学模式来识别卵巢癌”,柳叶刀,359(9306),2002,第572-577页。