基于深度学习的三维脑肿瘤分割

这个示例使用:

打开生活的脚本

这个例子展示了如何训练一个三维U-Net神经网络和执行语义分割脑肿瘤从三维医学图像。

语义分割包括用类标记图像中的每个像素或三维体素。这个例子说明了如何使用深度学习方法在磁共振成像(MRI)扫描中对脑肿瘤进行二元语义分割。在这种二值分割中，每个像素都被标记为肿瘤或背景。

本例使用三维U-Net架构进行脑肿瘤分割[1］.U-Net是一种快速、高效、简单的语义分词网络，目前在语义分词领域非常流行。

医学图像分割的一个挑战是存储和处理3d体积所需的内存量。由于GPU资源的限制，在全输入量上训练网络是不切实际的。这个例子通过在图像补丁上训练网络来解决这个问题。该示例使用重叠策略将测试补丁缝合到一个完整的分段测试卷中。该示例通过使用神经网络中卷积的有效部分来避免边界伪影[5］.

医学图像分割的第二个挑战是，当使用传统的交叉熵损失时，数据中的类别不平衡妨碍了训练。这个例子通过使用加权多类骰子损失函数解决了这个问题[4］.加权课程有助于对较大区域对骰子分数的影响，使网络更容易学习如何分割更小的区域。

下载培训，验证和测试数据

此示例使用BRATS数据集[2］.Brats数据集包含脑肿瘤的MRI扫描，即胶质瘤，这是最常见的主要脑恶性肿瘤。数据文件的大小为约7 GB。如果您不想下载BRATS数据集，则直接转到下载佩带的网络和样本测试集节。

创建一个目录来存储BraTS数据集。

imageDir = fullfile (tempdir,“小鬼”）;如果~存在(imageDir“dir”mkdir (imageDir);结束

要下载BraTS数据，请到医疗细分迪卡侬，然后点击“下载资料”链接。下载Task01_BrainTumour.tar文件[3.］.将tar文件解压缩到由此指定的目录中imageDir变量。当成功解压缩,imageDir将包含一个名为Task01_BrainTumour它有三个子目录:imagesTr，imagesTs，和labelsTr．

该数据集包含750个4-D卷，每个卷代表一堆3-D图像。每个4-D卷的尺寸为240 × 240 × 155 × 4，其中前三个维度对应于一个3-D体积图像的高度、宽度和深度。第四维对应不同的扫描方式。该数据集被分为484个带有体素标签的训练卷和266个测试卷，测试卷没有标签，所以本例没有使用测试数据。相反，该示例将484个训练卷分成三个独立的集，用于训练、验证和测试。

预处理培训和验证数据

要更有效地培训3-D U-Net网络，请使用辅助功能预处理MRI数据preprocessBraTSdataset．这个函数作为支持文件附加到示例中。金宝app

helper函数执行以下操作:

将数据裁剪到主要是大脑和肿瘤的区域。裁剪数据减少了数据的大小，同时保留每个MRI卷的最关键部分及其相应的标签。
将每个体积的每个模态单独归一化，方法是减去平均值并除以剪裁后的大脑区域的标准偏差。
将484次训练卷分成400次培训，29份验证和55个测试集。

数据预处理大约需要30分钟。

sourceDataLoc = [imageDir filesep .“Task01_BrainTumour”];preprocessDataLoc = fullfile (tempdir,“小鬼”，“preprocessedDataset”）;preprocessBraTSdataset (preprocessDataLoc sourceDataLoc);

为培训和验证创建随机补丁提取数据存储

使用随机的补丁提取数据存储将训练数据提供给网络并验证训练进度。该数据存储从地面真实图像和相应的像素标签数据中提取随机斑块。在进行任意大容量的训练时，修补是一种常见的防止内存耗尽的技术。

创建一个imageDatastore来存储3d图像数据。因为mat文件格式是非标准的图像格式，所以必须使用mat文件阅读器来读取图像数据。你可以使用辅助的mat文件读取器，基质．这个函数作为支持文件附加到示例中。金宝app

volReader = @(x) matRead(x);volLoc = fullfile (preprocessDataLoc,'想象的'）;volds = imagedataStore（volloc，．..“FileExtensions”，'。垫'，“ReadFcn”, volReader);

创建一个pixelLabelDatastore(计算机视觉工具箱)存储标签。

lblLoc = fullfile (preprocessDataLoc,“labelsTr”）;ClassNames = [“背景”，“肿瘤”];pixelLabelID = [0 1];pixelLabelID pxds = pixelLabelDatastore (lblLoc,一会,．..“FileExtensions”，'。垫'，“ReadFcn”, volReader);

预览一个图像卷和标签。使用该标记的卷labelvolshow函数。设置背景标签的可见性，使背景完全透明(1)0．

卷=预览（volds）;标签=预览（PXD）;ViewPnl = Uipanel（图，“标题”，“标记训练卷”）;hpred = labelvolshow（标签，卷（：，：：：，1），'父母'viewPnl,．..'lablecolor'，[0 0 0; 1 0 0]）;hpred.Labelvisibility（1）= 0;

创建一个randomPatchExtractionDatastore它包含训练图像和像素标签数据。指定一个补丁大小为132 × 132 × 132体素。指定“PatchesPerImage”在训练过程中，从每对卷和标签中抽取16个随机定位的patch。指定迷你批处理大小为8。

patchSize = [132 132 132];patchPerImage = 16;miniBatchSize = 8;patchds = randomPatchExtractionDatastore (volds pxds patchSize,．..“PatchesPerImage”, patchPerImage);patchds.minibatchsize = minibatchsize;

按照相同的步骤创建randomPatchExtractionDatastore它包含验证图像和像素标签数据。随着时间的推移，您可以使用验证数据来评估网络是否在持续学习、欠拟合或过拟合。

vollocval = fullfile（preprocessdataloc，“imagesVal”）;voldsVal = imageDatastore (volLocVal,．..“FileExtensions”，'。垫'，“ReadFcn”, volReader);lblLocVal = fullfile (preprocessDataLoc,“labelsVal”）;pxdsval = pixellabeldataStore（lbllocval，classnames，pixellabelid，．..“FileExtensions”，'。垫'，“ReadFcn”, volReader);dsVal = randomPatchExtractionDatastore (voldsVal pxdsVal patchSize,．..“PatchesPerImage”, patchPerImage);dsVal。MiniBatchSize = MiniBatchSize;

设置3-D U-Net层

本例使用3d U-Net网络[1］.在U-NET中，初始卷积层系列耦合到MAX池层，连续降低输入图像的分辨率。这些层之后是一系列卷积层，其遍历上采样操作员，连续增加输入图像的分辨率。在每个Relu层之前引入批量归一化层。U-Net的名称来自于网络可以用与字母U类似的对称形状绘制。

通过使用使用默认的3-D U-Net网络unetLayers(计算机视觉工具箱)函数。指定两个类分割。当使用重叠策略预测测试量时，还指定有效的卷积填充以避免边界伪影。

numChannels = 4;inputPatchSize = [patchSize numChannels];numClasses = 2;[lgraph, outPatchSize] = unet3dLayers (inputPatchSize numClasses,“ConvolutionPadding”，“有效”）;

通过使用使用的培训和验证数据来增加培训和验证数据变换函数具有helper函数指定的自定义预处理操作augmentAndCrop3dPatch．这个函数作为支持文件附加到示例中。金宝app

的augmentAndCrop3dPatchFunction执行以下操作:

随机旋转并反映培训数据，使培训更加强大。该功能不旋转或反映验证数据。
作物响应补丁的输出大小的网络，44 × 44 × 44体素。

数据源=“培训”；dstrain =转换（patchds，@（patchin）augmentandcrop3dpatch（patchin，partpatchsize，dataSource））;数据源=“验证”；dsVal =变换(dsVal @ (patchIn) augmentAndCrop3dPatch (patchIn outPatchSize,数据源));

为了更好地分割较小的肿瘤区域并减少较大背景区域的影响，本例使用adicepixelclassificationlayer.(计算机视觉工具箱)．将像素分类层替换为骰子像素分类层。

outputLayer = dicePixelClassificationLayer (“名字”，'输出'）;lgraph = replaceLayer (lgraph,“Segmentation-Layer”, outputLayer);

数据已经在预处理培训和验证数据这个例子的一部分。数据规范化image3dinputlayer.(深度学习工具箱)不必要，因此用没有数据归一化的输入层替换输入层。

inputLayer = image3dInputLayer (inputPatchSize,“归一化”，“没有”，“名字”，“ImageInputLayer”）;lgraph = replaceLayer (lgraph,“ImageInputLayer”, inputLayer);

或者，您可以使用深度学习工具箱™中的深度网络设计器应用程序修改3-D U-Net网络。

绘制更新后的三维U-Net网络图。

analyzeNetwork (lgraph)

指定培训选项

训练网络使用亚当优化求解。属性指定超参数设置培训选项(深度学习工具箱)函数。初始学习率设置为5e-4，并随着训练的持续而逐渐降低。你可以用小匹匹匹匹配属性基于您的GPU内存。为了最大限度地利用GPU内存，最好使用大的输入补丁而不是大的批量大小。注意，批处理规格化层对于较小的值效果较差小匹匹匹匹配．调整初始学习率基于小匹匹匹匹配．

选项=培训选项（“亚当”，．..“MaxEpochs”，50，．..'italllearnrate'5的军医,．..“LearnRateSchedule”，“分段”，．..“LearnRateDropPeriod”5,．..'学习ropfactor', 0.95,．..'vightationdata'，dsval，．..“ValidationFrequency”，400，．..“阴谋”，“训练进步”，．..“详细”假的,．..“MiniBatchSize”, miniBatchSize);

下载佩带的网络和样本测试集

从BraTS数据集下载预先训练过的3d U-Net版本和五份样本测试卷及其相应的标签[3.］.预先训练的模型和样本数据使您能够对测试数据进行分割，而无需下载完整的数据集或等待网络训练。

trained3DUnet_url =“//www.tatmou.com/金宝appsupportfiles/vision/data/brainTumor3DUNetValid.mat”；sampleData_url =“//www.tatmou.com/金宝appsupportfiles/vision/data/sampleBraTSTestSetValid.tar.gz”；imageDir = fullfile (tempdir,“小鬼”）;如果~存在(imageDir“dir”mkdir (imageDir);结束下载3dunetsampledata（trouth3dunet_url，sampledata_url，imagedir）;

列车网络的

默认情况下，本例加载一个预先训练好的三维U-Net网络。预先训练过的网络使您无需等待训练完成就可以运行整个示例。

要训练网络，请设置doTraining以下代码中的变量真正的．训练模型使用Trainnetwork.(深度学习工具箱)函数。

在可用的GPU上进行训练。使用GPU需要并行计算工具箱™和支持CUDA®的NVIDIA®GPU。有关更多信息，请参见GPU支金宝app持情况(并行计算工具箱)．在4个NVIDIA™Titan Xp GPU的多GPU系统上，培训大约需要30个小时，根据您的GPU硬件，可能需要更长时间。

doTraining = false;如果dotrained modeldateTem = string（DateTime（“现在”，“格式”，“yyyy-MM-dd-HH-mm-ss”));(网络,信息)= trainNetwork (dsTrain、lgraph选项);保存(strcat (“trained3DUNet——”modelDateTime,“时代——”num2str (options.MaxEpochs),“.mat”），“净”）;别的inputPatchSize = [132 132 132 4];outPatchSize = [44 44 44 2];负载(fullfile (imageDir'训练3dunet'，'braintumor3dunetvalid.mat'));结束

对测试数据进行分割

强烈建议使用GPU来执行图像卷的语义分割（需要并行计算工具箱™）。

选择测试数据的源，其中包含接地真理卷和标签进行测试。如果你保留useFullTestSet变量为假，则示例使用5卷进行测试。如果你设置useFullTestSet变量到真正的，则示例使用从完整数据集中选择的55张测试图像。

useFullTestSet = false;如果usfulltestset volLocTest = fullfile(preprocessDataLoc，“变化节”）;lblLocTest = fullfile (preprocessDataLoc,“labelsTest”）;别的volloctest = fullfile（imagedir，“sampleBraTSTestSetValid”，“变化节”）;lblLocTest = fullfile (imageDir,“sampleBraTSTestSetValid”，“labelsTest”）;ClassNames = [“背景”，“肿瘤”];pixelLabelID = [0 1];结束

的voldsTest变量存储地面真理测试图像。的pxdsTestVariable存储ground真值标签。

volReader = @(x) matRead(x);voldsTest = imageDatastore (volLocTest,．..“FileExtensions”，'。垫'，“ReadFcn”, volReader);pixelLabelID pxdsTest = pixelLabelDatastore (lblLocTest,一会,．..“FileExtensions”，'。垫'，“ReadFcn”, volReader);

使用重叠策略来预测每个测试量的标签。每个测试体积被填充，使输入大小为网络输出大小的倍数，并补偿有效卷积的影响。重叠算法选择重叠的patch，利用该算法预测每个patch的标签semanticseg(计算机视觉工具箱)功能，然后重新组合补丁。

id = 1;尽管hasdata (voldsTest) disp ([“处理测试量”num2str（ID）]）;tempgroundtruth =读（pxdstest）;TroundTruthlabels {id} = tempgroundtruth {1};Vol {id} =读取（VoldStest）;%对测试图像使用反射填充。%避免填充不同的模式。volsize = size（vol {id}，（1：3））;Padsizepre =（InputPatchsize（1：3）--outpatchsize（1：3））/ 2;padsizepost =（InputPatchsize（1：3）--outpatchsize（1：3））/ 2 +（分开（1：3）-mod（剧集，分类（1：3））;volpaddedpre = padarray（vol {id}，padsizepre，“对称”，“以前”）;volPadded = padarray (volPaddedPre padSizePost,“对称”，“职位”）;[heightPad, widthPad depthPad ~] =大小(volPadded);(高度、宽度、深度、~)=大小(卷{id});tempSeg =分类(0(高度、宽度、深度,“uint8”），[0; 1]，ClassNames）;%重叠的策略分割的体积。为k = 1: outPatchSize (3): depthPad-inputPatchSize (3) + 1为j = 1: outPatchSize (2): widthPad-inputPatchSize (2) + 1为i = 1:outPatchSize(1):heightPad-inputPatchSize(1)+1 patch = volpads (i:i+inputPatchSize(1)-1，．..J：J + InputPatchSize（2）-1，．..凯西:k + inputPatchSize (3) 1:);patchSeg = semanticseg(补丁,净);tempSeg(我+ outPatchSize (1) 1．..j: + outPatchSize (2) 1,．..凯西:k + outPatchSize (3) 1) = patchSeg;结束结束结束裁掉额外的填充区域。tempSeg = tempSeg(1:身高、1:宽度、1:深度);%保存预测的卷结果。predigeLabels {id} = tempseg;ID = ID + 1;结束

与网络预测进行比较

选择一幅测试图像来评估语义分割的准确性。从4-D体积数据中提取第一个模态，并将这个3-D体积存储在变量中vol3d．

volId = 1;vol3d = {volId}卷(::,:,1);

在蒙太奇中显示地面真理的中心切片和深度方向的预测标签。

zID =大小(vol3d, 3) / 2;zSliceGT = labeloverlay (vol3d (:,:, zID) groundTruthLabels {volId} (:,:, zID));zSlicePred = labeloverlay (vol3d (:,:, zID) predictedLabels {volId} (:,:, zID));图蒙太奇({zSliceGT, zSlicePred},“大小”(1 - 2),“BorderSize”5)标题(“标记地面真相(左)vs.网络预测(右)”）

显示地面真相标记卷使用labelvolshow函数。设置背景标签的可见性，使背景完全透明(1)0．因为肿瘤在脑组织内部，所以要使一些脑体素透明，这样肿瘤就可以被看到。为了使一些脑体素透明，将体积阈值指定为[0,1]范围内的一个数字。低于这个阈值的所有归一化体积强度都是完全透明的。本例将体积阈值设置为小于1，以便一些大脑像素保持可见，以提供肿瘤在大脑中的空间位置的上下文。

viewPnlTruth = uipanel(图,“标题”，真实的标签卷”）;hTruth = labelvolshow (groundTruthLabels {volId}, vol3d,'父母'viewPnlTruth,．..'lablecolor'，[0 0 0;1 0 0]，“VolumeThreshold”, 0.68);hTruth.LabelVisibility (1) = 0;

对于相同的卷，显示预测的标签。

viewPnlPred = uipanel(图,“标题”，“预测标签卷”）;hPred = labelvolshow (predictedLabels {volId}, vol3d,'父母'viewPnlPred,．..'lablecolor'，[0 0 0;1 0 0]，“VolumeThreshold”, 0.68);hpred.Labelvisibility（1）= 0;

该图像显示了在一个卷上顺序显示切片的结果。标记的地面真理在左边，网络预测在右边。

量化细分精度

利用骰子函数。该函数计算预测和地面真值分割之间的Dice相似系数。

diceResult = 0(长度(voldsTest.Files), 2);为j = 1:length(vol) dicerresult (j，:) = dice(groundTruthLabels{j}，predictedLabels{j});结束

计算一组测试卷的平均骰子分数。

meanDiceBackground =意味着(diceResult (: 1));disp ([“平均骰子得分的背景”num2str (j),．..' test volumes = '，num2str(meanDiceBackground)]) meandic肿瘤= mean(dicerresult (:，2));disp ([“肿瘤的平均骰子得分”num2str (j),．..' test volumes = 'num2str (meanDiceTumor)])

图中显示了一个箱形图(统计学和机器学习工具箱)它可视化了5个样本测试卷中Dice分数的统计数据。图中的红线表示类的骰子值的中值。蓝色框的上下限分别表示第25和75个百分点。黑须延伸到最极端的数据点，而不考虑异常值。

如果您有统计学和机器学习工具箱™，那么您可以使用箱形图函数可视化关于所有测试卷的Dice分数的统计数据。创建一个箱形图，设置createBoxplot以下代码中的变量真正的．

createBoxplot = false;如果createBoxplot图形boxplot(dicerresult) title(“测试骰子精度”) xticklabels(类名)ylabel ('骰子系数'）结束

参考文献

[1] Cicek O。，A. Abdulkadir, S. S. Lienkamp, T. Brox, and O. Ronneberger. "3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation." In国际医学图像计算和计算机辅助干预会议论文集- MICCAI 2016．希腊雅典，2016年10月，第424-432页。

Isensee, F.， P. Kickingereder, W. Wick, M. Bendszus, K. H. Maier-Hein。脑肿瘤分割和放射组学生存预测:对BRATS 2017挑战的贡献在国际MICCAI脑病研讨会论文集．加拿大魁北克市，2017年9月，第287-297页。

[3]“脑癌”。医学分割十项全能。http://medicaldecathlon.com/

BRATS数据集由医疗细分牌号提供4.0使用许可证。所有保证和陈述都被忽视;有关详细信息，请参阅许可证。MathWorks®已修改链接的数据集下载佩带的网络和样本测试集这个例子的一部分。修改后的样本数据集被裁剪到一个主要包含大脑和肿瘤的区域，每个通道通过减去平均值并除以裁剪后的大脑区域的标准差独立地进行归一化。

[4] Sudre，C.H.，W.LI，W.LI，T.Vercauteren，S. Ourselin和M. J. Cardoso。“广义骰子作为高度不平衡分割的深度学习损失函数重叠。”医学图像分析中的深度学习和临床决策支持的多模态学习:第三届国际研讨会金宝app．加拿大魁北克市，2017年9月，第240-248页。

Ronneberger, O.， P. Fischer和T. Brox。U-Net:用于生物医学图像分割的卷积网络。在国际医学图像计算与计算机辅助干预会议论文集- MICCAI 2015．德国慕尼黑，2015年10月，第234-241页。可以在arXiv: 1505.04597。