技术文章和新闻稿

用深度学习重建电子显微镜数据的神经图

由Philip Laserstein和Vijay Iyer,Mathworks


研究人员在——部门马克斯·普朗克大脑研究所(MPI)的研究人员对大脑皮层中的神经网络进行了研究,以了解大脑如何处理感官体验来探测环境中的物体。他们的工作包括建造连接体-神经元回路图,用来识别神经元之间的个别连接。

与人工神经网络的“神经元”不同,生物神经元不会被组织成整齐的一维层。相反,它们被包装并连接在密集的3D空间填充网格中,只能从用电子显微镜的纳米分辨率捕获的脑组织的图像进行研究(图1)。

图1所示。约50万立方微米的哺乳动物皮层组织的致密重建,产生2.7米的神经元电缆,构成一个连接体,由34221个轴突之间约40万个突触组成。
莫塔,伯宁,布尔根斯,斯塔夫勒,贝宁,鲁姆巴,亨尼格,威斯勒,赫尔姆施塔特。躯体感觉皮层第四层的致密连接重建科学.2019年10月24日。转载AAAS许可。1

为什么要研究生物神经网络?

卷积神经网络(CNN)的灵感来自生物智能,CNN的神经元和层次的前馈连接类似于人类和其他动物的视觉皮层。增加的计算能力和大量数据的可用性提高了cnn的性能和准确性,但与人脑相比,它们的效率非常低,无论是在消耗的能量还是在训练中需要的标签上。部署在云计算环境中的大规模CNN分类器消耗的能力比人脑高出几个数量级,而一个蹒跚学步的孩子在看到几十个例子后就能学会分类物体,CNN需要数百万张精确标记的图像。依赖深度学习的研究团队正开始突破这些限制。通过分析连接体来理解进化是如何解决生物神经网络中的这些挑战的,研究人员可能会找到开发下一代人工神经网络的线索。

三维电子显微镜显示单个神经元的球状胞体和致密而曲折的细长神经元电缆网络连接神经元。单电缆,或轴突从每个神经元突出的是一个极薄的结构。小于直径小于一个微米,轴突连接到相邻神经元以及更远的神经元,例如相同皮质区域的不同层,或者即使在大脑的相对侧,也是多毫米的神经元。脑皮层中的每个神经元都可以在自己的局部树枝内的众多神经元的成千上万的众多神经元中获得连接,或者德德里特.这些单独的连接点(突触)在一个神经元的轴突索和另一个神经元的树突索之间是亚微米级的。

Endgingomics领域的研究人员的挑战是开发在跨越大范围的尺度上映射神经元连接的技术(图2)。Max Planck研究人员专注于ConcineMes的密集重建,需要在追踪神经元电缆中的最高可能精度的工作和识别电子显微镜体积中的突膜。挑战是大规模:脑皮质中的单个立方毫米灰质含有公里的分支神经元电缆和约10亿突触。

图2。大脑皮层中神经连接的尺度,从单个神经元之间的纳米级突触到毫米级连接距离。橙色=轴突;蓝色=树突。

从电子显微镜的数据connectomes的手动致密重建通常需要的工作数万小时,即使对于含有约100万的突触小的样品体积。要自动重建过程中的劳动密集型部分,连接组学的部门开发FocusEM,工作流程,结合了自动化人的注释搭载在MATLAB创建卷积神经网络®.CNN模型在高性能计算(HPC)集群上使用并行处理进行训练和执行。

Focusem可以在躯体感染皮层中重建0.9米的树突和约1.8米的轴突,识别近500,000个突触,只有4000人工工作时间,比以前更有效地提供10至25倍。这项工作是发表在《科学在那里,研究人员展示了如此精确的高密度重建如何有助于详细了解局部脑回路。

连接体重建的挑战

为了给样本成像,提取一块脑组织并用重金属化合物进行染色。样本被转移到配有定制切片机的电子显微镜中。组织成像与组织切片交替进行,其中25-30 nm的薄片由切片机的金刚石刀获得。成千上万的成像和切割变换产生了一个数百gb到tb大小的3D图像数据集(图3)。

图3。用于脑成像的连续扫描电子显微镜。神经元组织探针成像,然后用定制的切片机切割。切割和成像的交替导致三维图像堆栈。尺度条= 1µm。

为了映射一个连接,研究人员必须从每个神经元追踪轴突,因为它穿过3D音量,以识别它连接到其他神经元的位置。

当两个相邻的电缆片段被检测到时,研究人员必须仔细分析图像,以确定它们是同一轴突的一部分,还是通过突触连接的两个独立片段,还是不相关的片段。

深度学习用于大规模神经元电路重建

FocusEM工作流自动化了连接体重建过程中大部分耗时的注释和决策步骤。工作流包括三个主要阶段:

  • 基于图像处理算法和启发式的预处理步骤
  • 图像分割,基于图像处理算法和深度学习
  • 形态学重建,基于机器学习结合有针对性的人类查询

预处理阶段包括使用全局最小二乘求解器在3D样本体积内对单个2D图像切片进行对齐,掩盖易于识别的结构,如血管和细胞核,以及校正图像亮度。

图像分割阶段基于名为SeGem的工作流程,发表通过在杂志上连接组学马普部神经元在2015年赛格与图像分割算法,如分水岭变换组合使用定制的3D CNN。为500,000立方微米在当前研究的样品体积,所述赛格阶段产生15000000个不同体积段。

这个形态重建阶段依赖于一组机器学习分类器,这些分类器是在MATLAB中定制和训练的,以支持FocusEM工作流:金宝app

  • ConnectEM分类器确定两个相邻体积段物理连接的可能性,如连续神经电缆的一部分。
  • SynEM分类器确定相邻的体积片段是否与神经连接相对应,神经连接是发生在纳米尺度的细间隙上的突触(图2);这些可以通过不同的图像特征来识别,如突触小泡簇。
  • TypeEM分类器将体积片段分类为属于轴突、树突、树突棘头(潜在突触的位置)或非神经元细胞类型。

Focusem工作流程使用这些分类器来自动化密集重建过程中的许多步骤。训练有素的人类注释者专注于从分类器的定向查询来解决复杂的情况,例如多个神经电缆之间的过境情况。

与致密重建的手动方法相比,该半自动工作流程的结果大于工作时间的减少量大(图4)。Focusem工作流代码可用于从A下载GitLab库

图4.不同方法所需的工作时间密集地重建立方毫米神经组织。虽然手动方法耗时且昂贵,但Focusem允许在现实的时间框架和成本内密集大脑体积的重建。

高性能计算加速

除了最小化完成连接体密集重建所需的人力工作时间,Max Planck的研究人员还试图最小化FocusEM工作流中自动化步骤所需的计算时间。

为了实现这一目标,研究人员转向了并行计算。Connectomics部门通过MATLAB Parallel Server™访问一个包含2500个CPU核和32个gpu的计算集群。该团队使用并行计算工具箱™来帮助并行图像预处理算法和自定义CNN分类器。除了全局图像配准步骤,密集重建工作流中的大部分计算步骤都是数据并行的,因为分类器可以同时运行在样本体积的不同部分。

“多功能性和速度是我们开发过程中的首要任务。从初始想法转移到高度并行化生产部署的能力而无需重写代码或重新思考数据结构对我们的团队至关重要。“

Moritz Helmstaedter,马克斯·普朗克大脑研究所连接组学部主任

为50万立方米微米样品体积重建,FocusEM计算步骤需要花费大约100个小时的计算时间。有需要的人4000工作小时数相比,计算工作,因此不是一个瓶颈。大部分FocusEM处理的被计算的CPU和他们使用他们的本地CPU容量(384芯)的20%。GPU的使用,加快赛格培训定制用于图像分割深学习分类。

分析连接组

最大普朗克研究人员已经完成了500,000立方米微米的第一次密集的重建,Max Planck研究人员分析了所产生的连接和几何数据。他们的分析产生了对此生活神经网络的本地性质的有价值的见解:

  • 不同类别的神经元(兴奋性抑制)以不同的神经支配模式联系目标细胞,证实了之前仅使用连接组数据的实验结果。
  • 轴突和树突填充皮质体积的几何规则并不能解释观察到的连接模式,这是一些先前的理论模型所提出的。
  • 通过测量连接体中突触大小的分布,可以深入了解大脑中可能发生的学习过程。

该研究的样本量比以往密集的皮质重建的样本量大300多倍,跨越了约7000个轴突和约40万个突触,为解决局部脑回路的这类问题提供了前所未有的统计能力。

进一步研究计划

建立了致密皮层重建的可行性和科学价值在当前的500000立方微米尺度,马普研究小组目前正在获得更多类型的大脑样本,允许比较物种之间和不同的大脑状态,疾病和健康状况等。

连接组学部门也开始着手解决进一步的挑战,即重建跨越多个大脑层的更大的皮层体积,并包含更远距离的神经连接。他们继续改进自动化技术,如FocusEM,以降低密集重建的成本。目前正在对一立方毫米样本容量的拍字节大小的数据集进行分析,这一数据集与过去大脑功能研究中确定的功能单元的规模相匹配。到目前为止,使用并行化的MATLAB所取得的结果表明,他们可以在不妨碍整体重构工作的情况下,在本地集群上为pb大小的数据集完成FocusEM计算步骤。

1读者只能浏览、浏览和/或下载临时复制目的的材料,前提是这些用途是非商业性的个人目的。除法律规定外,未经出版者事先书面许可,不得进一步复制、分发、传送、修改、改编、表演、展示、出版或部分出售本材料。

发布2020年

查看相关行业的文章