深度学习

理解和使用深度学习网络

从桌面到云的深入学习研究

实现头颈部肿瘤分割的多个人工智能实验

以下文章来自MathWorks的应用工程师Arnie Berlin

概述

随着深入学习的深入学习,越来越多的科学和工程学科,需要支持这种空间的实验和可扩展的工作流程。金宝app他们本质上捆绑在一起。与一名弗赖堡大学医学研究团队合作,为自动化头部和颈部肿瘤细分进行研究[1]我协助他们开发深入学习的工作流程。该研究的目的是辅助辐射学家目前可能更快,更准确的诊断。研究小组收集了一个患者数据集,包括每个患者扫描的MRI数据的7个相应模式。每组扫描都可以非常大,大约33.6 mbytes。研究人员想问的问题是,这些模式中的哪一个最有影响力,哪个是最少的?答案是,他们可以减少数据的大小,从而减少培训的时间和成本。

此博客将讨论实现工作流程的详细信息以及从桌面计算机到AWS云计算机缩放的注意事项。研究人员的问题的性质需要在大型数据集上进行许多深入学习培训的试验。他们需要能够在廉价,单个GPU计算机和详尽实验中运行小实验,即在强大的多GPU计算机配置上具有许多试验。

留下一次分析

方式是不同的MRI运作模式,并将是深入学习空间中的通道。研究人员确定最少,最有影响力的方式的过程是休假 - 一次性分析(LOO)。该概念是培训和测试一个深入学习模型,其中包括所有模态数据,以及每个模态都会被遗漏。此分析需要共有8个培训和测试运行。

图1.对频道的左一射的描绘

每组患者数据也需要相同的分析。每个文件都是需要转弯并成为交叉引用的测试数据。有36名患者数据集。每个训练运行中的每一个现在乘以每次左掉文件的36次,因此共有288个培训和测试运行或实验试验。

图2.对频道和文件的左单次描述。用于测试的左侧文件

图3。最终研究结果:左图显示了每个频道36次试验的分组。右边的图表显示了汇总结果,值越高,结果越好。

最终详尽的实验设置和成本

为了完成这个详尽的训练,分析被划分到6个在AWS上并行运行的计算实例上。在AWS平台上,实例是单个计算机配置。Freiburg团队在了解到g4dn可能是一种成本更低的替代方案之前,首先在许多训练运行中试验了更昂贵的P3实例类型。团队选择了G4dn.类型。G4DN配备单次NVIDIA TESLA T4 GPU。每次试验大约需要4个小时,完成288次试验8天。每个例子节点每小时0.56美分,它花费了1400美元。这可能并不是太不合理,但它需要花费大量时间并尝试构建工作流程,确定最佳配置,数据存储选项,并确定最佳的深度学习参数。每次训练实验1000美元,更不用说失去的时间等待几天完成,很快就会成为预算的吹风机。

图4.弗莱堡大学的最终实验运行描绘

调整需要多次迭代以达到最终培训。了解云上的不同选项以及如何实现可扩展系统和工作流程,以最大限度地减少彻底培训的成本。大型培训努力需要最小化昂贵设备的时间,并最大限度地减少等待完成的工程时间。有实验与数据存储选项,最大限度地减少大型数据集,网络模型,数据预处理和增强的读取时间,电脑配置如何处理,图像和图像补丁大小,以及学习超参数。Freiburg在更昂贵的P3和G4DN之间的团队实验是这样的一个例子。

工作流程

使用深度网络设计师构建原型模型

另一个实验阶段是选择网络模型。该团队发现了一种名为DeepMedic[2]的最新模型,在脑组织上取得了一些成功。他们做了一些与UNet模型的初步实验比较,发现DeepMedic需要的资源更少,这有望导致更短的训练运行。该团队选择使用DeepMedic模型的两种输入版本,这两种输入都是从相同的接受域提取的,但其中一种作为下采样处理,分辨率较低。因此,低级和高级细节都有助于在更紧凑的模型中进行预测。下采样的路径在重新组合之前是上采样的。最终输出类似于仅编码的语义分割模型。为了在原始数据上提供输出类的覆盖,输出必须按原始数据的大小缩放。请参阅下图以获得描述。

图5。描述两个输入的DeepMedic网络模型

我们发现我们可以使用单个输入实现架构,并在使用自定义裁剪层将其分为两条路径。

图6。“深度网络设计器”的屏幕截图(点击可增强)

由于该模型很大并且有许多重复部分,它可以在构建过程的早期阶段导出,然后可以直接编辑脚本,更轻松地编辑复制,粘贴和名称替换。在完成重复零件时,可以运行脚本以在工作区中生成模型以进行导入到设计器以完成。

开发数据存储和转换功能,用于管理培训和测试数据

为深度学习进行管理和操纵数据集可能非常具有挑战性和耗时。MATLAB使用数据存储对象来促进深度学习。对象和相关构造支持预处理和后处理,增强,后台处理和分发到并行节点和GP金宝appU。看使用数据存储入门。创建了每个患者的文件夹层次结构和每个扫描事件的映像文件。每个MRI扫描事件包含7个不同对比度加上地面真理数据的模态。每次扫描都包含不同数量的切片和不同的分辨率。金宝搏官方网站如前所述,该团队能够实施自己的注册和规范化配方,但缺乏此博客的范围。imageageAtastore.用于访问数据。由于文件夹重载了多个数据表示,并且只需要归一化文件,因此对包含“归一化”字符串的文件进行了过滤数据存储列表,并且从生成的列表重建数据存储。

使用数据存储子集方法进一步细分为培训,验证,测试数据集。

训练所需的图像大小大约是165x165x9体素x 7个通道,这比每个文件中的数据小得多。决议必须保留,否则会丢失太多的资料。对于语义分割问题,从输入文件中提取匹配训练输入大小的随机块是典型的方法。有时也需要平衡背景体素计数与前景体素,这有额外的好处,减少训练时间。有一个内置的randampatchExtractionDatastore.要做些类似的事情,但提取的位置需要更多的控制,每个文件和增强的读数数。幸运的是,数据购物转变功能允许这个。

使用BlockedImageDatastore

研究团队了解到,即使只需要一小部分,每次阅读都只需要一小部分,也是妨碍性能。通过从随机选择的修补程序创建新数据集来创建若干工作。在R2021A中,BlockedImage.blockedImageDatastore添加了对象,提高了这些操作的性能。在实例化时,BlockedImage.将生成基于指定块大小的片段文件文件夹。然后只读取指定区域所需的片段。它还将为每个块片段生成掩码和像素标签统计数据,以便选择匹配统计元素的区域,这有助于平衡用于训练的数据。

生成可视化

在进行深度学习时,可视化数据可能是具有挑战性的。MATLAB提供交互式工具,以支持卷和覆盖图形的可视化。金宝app以下是一个使用的例子蒙太奇从每个模态显示相应的切片,以及地面真相。Labeloverlay.用于覆盖对应图像上的分类数据。地面真理和预测的分割标签通常表示为分类类型。

图7.所有7个频道的中间切片的蒙太奇/模态和地面真理。(点击增强图像)

卷Viewer应用程序提供用于选择和查看卷切片的功能,具有多种模式,用于查看覆盖标签。

图8.切片平面模式中的VolumeViewer应用程序和T1通道的标签模式和地面真理

使用实验经理进行调优模型

在2021A之前,研究团队促进了使用嵌套环的实验,这可能是迭代训练模型的繁琐途径。21A后,实验管理员App USTANTED脚本最初实施以支持贝叶斯优化和网络培训的LOO工作流程。金宝app该应用程序的目的是运行具有多个变量的实验,其中为每个变量指定了范围。在“扫描”模式下,LOO分析所需的模式,它将为每个变量排列运行培训试验。在“贝叶斯”模式下,根据贝叶斯优化算法,运行可变组合的培训试验。下面是基于a的示例的屏幕捕获三维脑肿瘤分割与原始研究数据相似的例子。贝叶斯和LOO的应用类似。

图9.贝叶斯优化和扫描模式设置面板(点击增强图像)

图10.休留训练

图11。贝叶斯培训。试验16的学习率达到了最好的结果。

从CPU扩展到GPU和云系统

其中一个挑战是具有可扩展的培训环境。研究团队访问更强大的单GPU设备和并行计算工具箱的访问权限有限,他们可以访问AWS上的1,2,4或8-GPU设备。因此,对于普通脚本调试和有限培训,客户将使用他们的个人计算机;有关更多时间密集的工作流程故障排除和改进,他们将与他们的内部单人GPU电脑安排时间,并为重型训练和贝叶斯优化,他们将针对基于AWS的多GPU实例。

该团队决定使用RDP选项。这涉及设置Amazon Web服务(AWS)帐户,定义EC2计算平台实例(费用为每小时)并将数据传送到弹性块存储(EB)。初始实例是使用MATLAB参考体系结构创建的,然后可以为用户或应用程序要求修改它。EBS可以安装到IT或S3可作为网络存储访问。

并行和在云中扩展深度学习在文档中深入讨论。

一个很好的功能是计算机实例配置(和成本)在启动时很容易更改。如果培训有限或仍处于故障排除或改进模式,则可以选择具有单个GPU模式的较小实例,或者当需要完全培训时,可以选择最大GPU,它将更快地完成。学习率依赖于小型尺寸:如果希望通过增加小纤维大小来使用GPU的全部资源,则应考虑不同的学习率。

结论

随着AI解决方案的新时代,有很多关于如何应用I金宝搏官方网站T的研究,但需要实验来识别最佳参数。有很多实验来进入最终结果,即理解哪种方式重要(见图2)。弗赖堡团队能够通过缩放到云,利用GPU并使用各种应用来实现这一目标。

参考

Bielak, L., Wiedenmann, N., Berlin, A.等。基于卷积神经网络的7通道多参数MRI头颈部肿瘤分割:一种遗漏分析。辐射Oncol 15, 181(2020)。https://doi.org/10.1186/s13014-020-01618-z.
[2] Kamnitsas k,Ledig C,Newcombe VFJ,Simpson JP,Kane Ad,Menon DK,Rueckert D,Glocker B.具有完全连接CRF的高效多尺度3D CNN,用于精确的脑病变细分。Med图像肛门。2017; 36:61-78https://doi.org/10.1016/j.media.2016.10.004
有问题要问Arnie吗?请在下方留言
|
  • 打印
  • 发电子邮件

评论

要留下评论,请点击这里登录到您的MathWorks帐户或创建一个新帐户。