利用成像流式细胞术和深度学习自动化基因毒性分析

由斯旺西大学保罗雷斯


基因毒性试验用于评估化学制剂(如药物)对遗传物质(DNA和RNA)的损害,并经常用于测试候选药物的安全性。过去,训练有素的实验室技术人员手工进行分析,使用显微镜检查数千个单个细胞,以确定DNA损伤的生物标记:通过细胞分裂形成微核(MN)(图1)。这种方法不仅费时费力,而且依赖于每个技术人员的主观判断。

图1所示。左上:单核细胞;右上:单核微核细胞。左下:双核细胞;右下:双核微核细胞。左:亮场图像;右图:核荧光图像。

我在斯旺西大学的研究小组开发了一种基于深度学习和流式细胞术成像(IFC)的基因毒性和类似研究的自动化方法。我的合作者George Johnson博士的实验室使用IFC从单个细胞收集多通道图像数据。我们使用DeepFlow,一个为IFC[1]优化使用的深度学习网络,它使我们能够准确和自动地将图像分类为单核、单核配MN、双核或双核配MN(图2)。

图2.自动图像分类工作流程。

这种方法消除了手工方法的主观性,使分析在世界各地的实验室中以一致的结果进行。因为我们在MATLAB中实现了DeepFlow®使用深度学习工具箱™,我们可以将代码发送到我们与之合作的任何实验室,并且知道它将可靠地运行。许多研究人员已经熟悉MATLAB,这意味着它们可以轻松修改或改进代码和量身裁缝深流向其特定的实验设置。

建筑DeepFlow

我们最初使用Keras TensorFlow™实现DeepFlow,但决定在MATLAB中重新实现它,这样DeepFlow几乎可以在世界上的任何实验室中使用。我们希望我们的软件能够在特定实验室使用的流式细胞仪中正常工作。我们不想担心依赖关系,我们想要一个易于理解和修改的深度学习网络。

我们没有对Keras代码进行逐行翻译,而是使用Deep Network Designer应用程序来构建、可视化和训练DeepFlow网络。Keras代码在屏幕的一边,Deep Network Designer应用在另一边,我们简单地复制了初始实现的架构(图3)。

图3.深度网络设计器应用程序中的深流网络。

我们使用Deep Learning工具箱中的网络分析仪来检查网络及其层中的错误(图4)。例如,我们从一个为200x200像素的图像设计的网络开始,并将其缩小以处理我们从IFC获得的64x64像素的图像,利用网络分析仪对网络中每个卷积层的图像大小进行验证。我们的合作者在使用Deep network Designer应用程序对网络进行更改时也会使用网络分析器。

图4. Matlab网络分析仪应用中的Deepflow网络。

在基因毒性测定中使用深流量

在我们的实验设置中,我们使用的IFC能够在几分钟内处理10,000个细胞。我们捕获了明亮视野的图像以及核和微核的荧光图像,用使DNA更可见的溶液染色(图5)。

图5。CNN用于IFC数据的分类和可视化。[1]

我们将IFC数据带到MATLAB中作为MATLAB数据存储。我们利用传统的图像处理技术预处理,以基于其强度来重整每个图像,并确保每个图像在框架中完全焦点。我们使用边缘检测,例如,识别清洁边缘,其指示图像处于焦点,并且完全平坦的边缘,这表明相机没有捕获整个小区。

我们用DeepFlow CNN对2000多张人工分类图像进行训练。一旦我们从IFC中得到一组标准化的、干净的数据,我们就使用训练过的网络将图像分类为有单核、双核、三核或四核细胞(含MN或不含MN)的图像。最后,使用一个确定的公式来计算每一类细胞的百分比,我们可以评估用于治疗细胞的药剂的毒性。

我们发现,深流网络中最终分类层上方的层对了解训练的CNN是如何工作的,特别值得注意。要解析嵌入在此图层中的信息,我们使用MATLAB应用at-分布式随机邻域嵌入(tSNE)算法用于可视化高维数据(图6)。这些可视化可以揭示图像数据中的细微差别,这些细微差别在人工检查中几乎无法察觉。例如,有微核的双核细胞和单核细胞之间的关系表明大小决定了正常核和微核之间的区别。

图6.显示来自遗传毒性测定的典型细胞类型的数据的TSNE可视化。

利用弱监督学习将深流原则扩展到血液质量评估

除了基因毒性研究之外,我们还在各种分析和分类应用中使用了深度学习。例如,最近,我和我的同事使用CNN和弱监督学习来研究随着[2]时间的推移红细胞(rbc)的降解。为输血而储存的血液中的红细胞发生储存损伤,观察细胞形态的变化,通常用显微镜进行人工评估。手工评估是难以置信的耗时,我们注意到不同的专家经常产生不同的分数。

对于RBC研究的第一部分,我们随着遗传毒性研究进行,培训具有手动标记为属于几种可能的形态之一的图像的CNN,或表型(图7)。经过训练的网络在分类形态方面与专家取得了超过76%的一致性,这与专家之间约79%的一致性相当。

图7。红细胞形态。

对于该研究的第二部分,我们消除了主观人类标签,并培训了弱监督的神经网络,Reset50,只使用血液在储存中的时间量。当我们通过基于遗传毒性研究中使用的基于TSNE的技术可视化结果时,我们发现网络已经学会了提取了单细胞功能,揭示了形态学变化的年代学进展(图8)。我们意识到这种进展可用于预测血液质量和储存血液的到期日,没有人类愈合的注释,减少血液浪费并帮助确保不适用于输血中的血液。

图8.在CNN可视化期间显示的表型(形态)的分布。

DeepFlow计划

我们的小组目前正在评估几个潜在的研究项目,将IFC与Matlab联合起来。一个项目在基因毒性研究上建立,但侧重于评估经过化疗的患者中白细胞的响应[3]。第二个将扩展Deepflow以滑动扫描分析,这可能使公司能够重新分析大量幻灯片扫描数据。我们还在开发深流的图形界面,我们将通过网络包装为单个独立应用程序。

关于作者

Paul Rees博士是斯旺西大学的工程教授和系统和过程工程中心(SPEC)的负责人。他的研究兴趣包括流式细胞术、生物医学图像分析建模、血块模拟和胶体量子点。

发布2020年

参考文献

  • [1]欧伦堡,P. Köhler, N.,布拉西,T.。等等。“利用深度学习重建细胞周期和疾病进展。”自然通讯8,463(2017)。doi:10.1038 / s41467-017-00623-3

  • [2] Doan, M., Sebastian, J.A.等人。“通过深度学习客观评价储存的血液质量。”国家科学院的诉讼程序2020年9月,117(35)21381-21390。doi:10.1073 / pnas.2001227117

  • [3] Doan,M.,案例,M.,Masic,D.,Hennig,H.,Mcquin,C.,Caiceo,J.,J.,Singh,S.,Goodman,A.,Wolkenhauer,O.,Summers,H.D., Jamieson, D., van Delft, F.W., Filby, A., Carpenter, A.E., Rees, P. and Irving, J. (2020). “Label‐Free Leukemia Monitoring by Computer Vision.”cytometr., 97: 407 - 414。doi:10.1002 / CYTO.A.23987

查看相关功能的文章

查看相关行业的文章