技术文章及通讯

物理机器学习:用于器官细胞生长研究的基于云的深度学习和声学模式

塞缪尔·j·雷蒙德,麻省理工学院


为了在实验室里用细胞培养器官组织,研究人员需要一种非侵入性的方法来固定细胞。一个有希望的方法是声学模式这涉及到在细胞发育成组织的过程中,利用声能来定位和保持细胞以所需的模式。通过将声波应用于微流控设备,研究人员已经将微米级的细胞驱动成简单的图案,如线条和网格。

我和我的同事开发了一种结合了深度学习和数值模拟的方法,使我们能够将细胞排列成我们自己设计的更复杂的模式。通过在MATLAB中执行整个工作流程,我们节省了数周的工作时间®并使用并行计算来加速关键步骤,例如从模拟器生成训练数据集和训练深度学习神经网络。

微通道声学图案化

在微流控装置中,流体和流体携带的颗粒或细胞在亚毫米大小的微通道中被操纵,这些微通道可以被制成不同的形状。为了在这些微通道中创建声学模式,使用数字间换能器(IDT)产生表面声波(SAW),并将其定向到通道壁(图1a)。在通道内的流体中,声波产生的压力最小值和最大值与通道壁对齐(图1b)。因此,通道壁的形状可以配置为在通道内产生特定的声场1(图1 c)。声场将流体中的粒子排列成与声波力最小化位置相对应的模式(图1d)。

图1。微通道中的声学图样。

图1。微通道中的声学图样。

虽然可以计算出由特定通道形状产生的声场,但反过来是不可能的:设计一个通道形状来产生所需的声场对于任何东西都不是一项简单的任务,除非是简单的网格状模式。由于解空间实际上是无界的,解析方法是不可行的。

这个新的工作流程使用了大量的模拟结果集合(随机形状)和深度学习来克服这一限制。我的同事和我首先通过在MATLAB中模拟已知形状的压力场来解决正问题。然后,我们使用结果来训练深度神经网络来解决反问题:识别产生所需声场模式所需的微通道形状。

解决正向问题:模拟压力场

在早期的工作中,我们的团队在MATLAB中开发了一个模拟引擎,使用惠更斯-菲涅耳原理求解给定特定通道几何结构的压力场,该原理认为平面波上的任何点都是球面波的点源(图2)。

图2。声压场产生的特定通道几何。

图2。声压场产生的特定通道几何。

模拟引擎依赖于各种矩阵操作。因为这些操作是在MATLAB中执行的,所以每个模拟只需要几分之一秒的时间就可以运行,我们需要模拟成千上万个独特的形状及其对应的2D压力场。我们使用并行计算工具箱™在多核工作站上并行运行模拟,从而加速了这一过程。

一旦我们获得了所需的数据,就可以用它来训练深度学习网络,从给定的压力场推断通道形状,本质上是颠倒输入和输出的顺序。

反问题的深度网络训练

首先,对模拟的压力场值进行阈值分割,加快训练速度;这导致创建了151 x 151个由1和0组成的2D矩阵,我们将其平展成一个1D向量,这将是深度学习网络的输入。为了最小化输出神经元的数量,我们使用傅里叶系数表示来捕获通道形状轮廓(图3)。

图3。等边三角形的傅立叶级数近似,旋转20个(从左到右)3,10和20个系数。

图3。等边三角形的傅立叶级数近似,旋转20个(从左到右)3,10和20个系数。

我们使用Deep network Designer应用程序构建了初始网络,并以编程方式对其进行优化,以平衡准确性、通用性和训练速度(图4)。我们使用NVIDIA上的自适应矩估计(ADAM)求解器训练网络®Titan RTX GPU。

图4。具有四个隐藏层的全连接前馈网络。

图4。具有四个隐藏层的全连接前馈网络。

验证结果

为了验证训练过的网络,我们使用它从给定的压力场推断出通道几何形状,并将该几何形状作为模拟引擎的输入来重建压力场。然后我们比较了原始压力场和生成的压力场。两个场内的压力最小值和最大值非常接近(图5)。

图5。深度学习网络验证流程。

图5。深度学习网络验证流程。

接下来,我们进行了一些真实世界的测试。为了指出我们想要粒子聚集的区域,我们用微软绘制了定制的图像®油漆。其中包括各种不同的单线和多线图像,如果没有我们的技术,这些图像将很难产生。然后使用训练过的网络来推断产生这些定义区域所需的通道几何形状。最后,在合作伙伴的帮助下,我们根据推断出的几何形状制造了一些微流体器件。将悬浮在流体中的1 μm聚苯乙烯颗粒注入到成形通道中,并对其施加声表面波。结果显示,粒子沿着我们定制图像中显示的区域聚集(图6)。

图6。下图:在Microsoft Paint中绘制的区域(紫色)叠加在模拟声场上,需要在这些区域中聚集颗粒。上图:制造的微流控装置中悬浮聚苯乙烯颗粒的结果图案。

图6。下图:在Microsoft Paint中绘制的区域(紫色)叠加在模拟声场上,需要在这些区域中聚集颗粒。上图:制造的微流控装置中悬浮聚苯乙烯颗粒的结果图案。

向云过渡

当我们展望这个项目的下一阶段时,我们正在更新我们的深度学习网络,使用声场图像作为输入,并产生通道形状的图像作为输出,而不是分别使用平坦矢量和傅里叶系数。希望这个改变能让我们使用傅里叶级数不能轻易定义的通道形状,因为傅里叶级数可以随时间变化。然而,这将需要更大的数据集进行训练,更复杂的网络架构,以及更多的计算资源。因此,我们正在将网络及其训练数据转移到云端。

幸运的是,MathWorks Cloud Center提供了一个方便的平台,可以快速启动和关闭高性能云计算资源的实例。在云中进行科学研究的一个比较烦人的方面是与实例的交互,这涉及到在云和本地机器之间移动我们的算法和数据。MATLAB Parallel Server™抽象了云计算更复杂的方面,使我们能够在本地或云中运行,只需单击几下简单的菜单。这种易用性让我们把注意力集中在科学问题上,而不是解决它所需的工具上。

使用MATLAB和NVIDIA gpu支持的Amazon Web Services实例,我们计划使用存储在Amazon中的数据来训练更新后的网络®S3™桶。然后,我们可以在本地工作站上使用经过训练的网络进行推断(不需要高性能计算),并对不同的声场模式进行实验。这项工作将为我们提供其他基于物理学的机器学习项目的基线。

确认

作者要感谢David J. Collins、Richard O 'Rorke、Mahnoush Tayebi、Ye Ai和John Williams对本项目的贡献。

1Collins, D. J., O 'Rorke, R., Devendran, C., Ma, Z., Han, J., Neild, A.和Ai, Y.“基于声道波导的微流控通道中的自对准声流控粒子聚焦和模式化”。理论物理。(1.120, 074502(2018)。

作者简介

Sam Raymond是斯坦福大学的博士后学者,在麻省理工学院的计算科学与工程中心(CCSE)完成了博士学位。他的研究兴趣包括基于物理的机器学习,应用高性能计算,深度学习和无网格方法来求解偏微分方程,以模拟现实世界的现象。

2020年出版的

查看相关行业的文章