技术文章和通讯

自动化基因毒性检测与成像流式细胞术和深度的学习

保罗•里斯斯旺西大学


基因毒性分析用于评估损害引起的遗传物质(DNA和RNA)化学剂等药物,常用于测试候选药物的安全性。在过去,训练有素的实验室技术人员手动进行化验,使用显微镜检查成千上万的单个细胞识别DNA损伤的生物标志物:形成微核(MN)在细胞分裂(图1)。除了作为劳动密集型和耗时的,这种方法依赖于每个技术人员的主观判断。

图1所示。左上:单核的细胞;右上:单核的细胞微核。左下:双核细胞;右下角:双核细胞微核。左:亮场图像;右:核荧光图像。

图1所示。左上:单核的细胞;右上:单核的细胞微核。左下:双核细胞;右下角:双核细胞微核。左:亮场图像;右:核荧光图像。

我在斯旺西大学研究小组开发了一个自动化的基因毒性和类似的方法研究基于深度学习和成像流式细胞术(IFC)。我的合作者乔治·约翰逊博士的实验室使用IFC收集多通道图像数据从单个细胞。我们使用DeepFlow,深入学习网络优化使用IFC[1],这使我们能够准确、自动分类的图像作为单个核,单一核锰、两个核,或两个原子核与MN(图2)。

图2。自动图像分类的工作流。

图2。自动图像分类的工作流。

这种方法消除了手工方法的主观性,使得分析执行一致的结果在世界各地的实验室。因为我们DeepFlow在MATLAB实现®深度学习工具箱™,我们可以将代码发送给任何实验室进行合作,并知道它将可靠地运行。许多研究人员已经熟悉MATLAB,这意味着他们可以很容易地修改或改进的代码和裁缝DeepFlow特定的实验装置。

建筑DeepFlow

我们最初实现DeepFlow使用Keras TensorFlow™但决定重新实现它在MATLAB DeepFlow可以用于几乎任何实验室在世界上。我们想让我们的软件工作无论什么流式细胞仪机器特定的实验室使用。我们不想担心依赖关系,我们想要深入学习网络,很容易理解和修改。

而不是我们的执行上翻译Keras代码,我们使用深层网络设计师应用建设,可视化和火车DeepFlow网络。与屏幕的一侧Keras代码和深层网络设计师应用,我们只是复制初始的架构实现(图3)。

图3。DeepFlow网络在网络设计师应用。

图3。DeepFlow网络在网络设计师应用。

我们使用网络分析仪在深度学习工具箱来检查网络中的错误及其层(图4)。例如,我们开始与网络为200 x200型像素的图像设计,规模与64年x64-pixel我们从国际金融公司得到的图像,使用网络分析仪来验证图像大小在每个卷积层网络。我们的合作者也使用网络分析仪时更改网络的深度网络设计师应用。

图4。在MATLAB DeepFlow网络网络分析仪应用。

图4。在MATLAB DeepFlow网络网络分析仪应用。

使用DeepFlow基因毒性分析

在我们的实验装置中,我们使用一个国际金融公司能够在几分钟内处理10000个细胞。我们捕捉图像以及荧光图像具有亮核和微核沾染了一个解决方案,使DNA更可见(图5)。

图5。CNN分类和IFC数据可视化。[1]

图5。CNN分类和IFC数据可视化。[1]

我们将IFC数据到MATLAB作为一个MATLAB数据存储。我们进行预处理与常规图像处理技术来renormalize每个图像根据其强度,并确保每个图像,细胞完全的框架。我们使用边缘检测,例如,确定清洁边缘,显示图像,和完全平坦的边缘,这表明相机没有捕捉到整个细胞。

我们训练DeepFlow CNN超过2000手动分类图像。一旦我们有了一个规范化的、清洁的IFC数据,我们使用训练网络分类图像mono -, bi - tri -或有或没有MN tetra-nucleated细胞。最后,使用的公式,计算细胞落入每个类别的比例,我们可以评估代理用于治疗的毒性细胞。

我们发现的层上方最终分类层DeepFlow网络是特别有价值的对于理解训练CNN是如何工作的。解析信息嵌入到这一层,我们使用MATLAB应用t分布式随机邻居嵌入(tSNE)算法对高维数据可视化(图6)。这些可视化可以揭示细微差别的图像数据,几乎难以察觉,手动检查。例如,细胞之间的关系分为双核和单核的微核表明大小决定正常核和微核之间的区别。

图6。tSNE可视化数据显示典型的细胞类型的基因毒性试验。

图6。tSNE可视化数据显示典型的细胞类型的基因毒性试验。

DeepFlow原则扩展到血液质量评估使用弱监督学习

除了基因毒性研究中,我们使用深度学习在各种分析和分类应用程序。举个例子,最近我和我的同事用CNN和弱监督学习研究红细胞(红血球)的降解[2]。贮存的血液中红细胞表面损伤的输血开发存储过程中,观察细胞形态的变化,通常评估手动用显微镜。手动评估是非常耗时的,我们注意到,不同的专家经常产生不同的分数。

对红细胞的第一部分的研究中,我们进行了基因毒性研究中,训练一个CNN的图像已经手动贴上属于几个可能的形态之一,或表型(图7)。训练网络取得了超过76%的协议与形态分类的专家,这是与专家之间的大约79%的协议。

图7。红细胞形态。

图7。红细胞形态。

对于这项研究的第二部分,我们消除了主观人类标签和弱监督神经网络训练,ResNet50,只使用血液的时间一直在存储。当我们使用的可视化结果与tSNE-based技术在基因毒性研究中,我们发现,网络已经学会提取单细胞特性,揭示了实足的形态变化(图8)。我们意识到这种发展可以用来预测血液质量和血液储存的截止日期没有宗教注释,减少血液浪费和帮助确保不使用不合适的血液输血。

图8。分布的表型(形态)在CNN的可视化显示。

图8。分布的表型(形态)在CNN的可视化显示。

DeepFlow计划

我们的团队目前正在评估一些潜在的研究项目,国际金融公司和深度学习与MATLAB相结合。一个项目建立在基因毒性研究,但重点是评估的反应在一个病人经历了化疗白细胞[3]。第二个会延长DeepFlow滑动扫描分析,这可能会使公司重新分析大量的滑动扫描数据。DeepFlow我们也开发一个图形化的界面,我们将包和网络作为一个独立的应用程序。

关于作者

教授保罗•里斯博士是工程、系统和过程工程中心在斯旺西大学(规范)。他的研究兴趣包括流式细胞仪,生物医学图像分析建模、血凝块模拟和胶体量子点。

2020年出版的

引用

  • [1]Eulenberg, P。科勒,N。布拉西,T。et al。“重建细胞周期和使用深度学习疾病进展。”自然通讯8日,463 (2017)。doi:10.1038 / s41467 - 017 - 00623 - 3

  • [2]Doan, M。塞巴斯蒂安,正当等人。“客观评估存储血液质量的深度学习。”美国国家科学院院刊》上2020年9月,117 (35)21381 - 21390。doi:10.1073 / pnas.2001227117

  • [3]Doan, M。,情况下,M。大规模,D。亨尼希,H。McQuin C。Caicedo, J。辛格,S。古德曼,。Wolkenhauer, O。夏天,收听距离杰米逊,D。,范·代尔夫特F.W.Filby,。、木工、A.E.里斯,p和欧文,j . (2020)。”的标签还是免费白血病由计算机视觉监控。”血细胞计数,97:407 - 414。doi:10.1002 / cyto.a.23987

查看相关文章的能力

为相关行业观点文章