使用图像处理和统计分析来量化癌症药物研究的细胞散射

格雷琴·阿加斯特(Gretchen Argast), OSI制药有限公司(OSI Pharmaceuticals, LLC),保罗·弗里克(Paul Fricker), MathWorks


上皮对间充质转换(EMT),对胚胎发育至关重要的过程,与成人癌症的传播有关。因此,除了靶向细胞增殖和存活的药物外,还增加了靶向EMT的癌症药物的兴趣。

直到最近,测量药物如何影响EMT的一个方面,即细胞散射,还是一个手动的过程,涉及主观评估培养细胞的相对亲密度。OSI制药公司的研究人员与MathWorks顾问合作开发了一种用于定量样品中细胞散射的自动化系统。基于MATLAB®、图像处理工具箱,统计和机器学习工具箱,该系统测量最邻近细胞的核-核距离。测量散射的能力对于评估可能抑制或逆转EMT的药物的功效至关重要,因为它为研究人员提供了一种可靠的方法来比较不同药物的效果。

EMT是什么?

在人类和其他脊椎动物中,有两种基本细胞类型:上皮细胞和间充质细胞。两种细胞的形态和功能特征不同。例如,上皮细胞的生存依赖于细胞间的接触。相比之下,间充质细胞的特征是它们独立于附近的细胞和它们的流动性,这是细胞散射的两个要求。

在EMT中,细胞失去上皮特征而获得间质特征。EMT对胚胎发育至关重要,因为它产生的间充质细胞可以迁移到需要的地方形成骨头、软骨和其他组织。然而,在成人中,EMT与癌症和纤维化等病理有关。由于间充质肿瘤细胞比上皮肿瘤细胞更容易移动,因此侵袭性更强,科学家认为它们促进了肿瘤的发展转移,或肿瘤细胞的扩散。EMT还会降低以上皮细胞为靶点的化疗治疗的有效性。

分析细胞样本图像

OSI研究人员已经开发出胰腺和肺肿瘤模型,并确定了一套配体,或结合分子,驱动这些模型中的EMT。其中两种配体,肝细胞生长因子(HGF)和oncostatin M (OSM),诱导了模型中的EMT,使我们能够制作出与EMT相关的细胞散射的样品。样品被染色,在我们的显微镜捕捉到的图像中,每个细胞的细胞核都是蓝色的(图1)。

图1所示。左:未处理的细胞样本,细胞核以蓝色显示。右图:用HGF和OSM (H+O)处理过的类似样品。

为了量化细胞的散射,我们开发了一个使用图像处理和统计分析的数值程序。如果图像完全被细胞覆盖,那么测量细胞的空间密度将相对简单:我们只需计算每张图像中的细胞核数量,然后除以图像的总面积。然而,我们生成的图像几乎总是被部分覆盖,这使得正确估计细胞密度变得困难。我们决定开发一种替代方法来量化散射,基于测量细胞核之间的距离。

为了分析细胞图像,我们使用了一种主要由四个步骤组成的算法:

  1. 阈值整个图像以分割细胞核,或细胞核簇。
  2. 分析结果斑点确定它们的大小(面积)。
  3. 放大较大的blob以执行本地化分析,以识别blob中的单个单元格。
  4. 识别(xy)-定位图像中每个细胞核。

由于强度缩放在所有捕获的图像上都是一致的,所以我们可以使用单个硬编码阈值捕获大多数单个斑点。该阈值过程产生二进制图像,其中细胞核由1或白色表示,并且其不存在由0或黑色表示(图2)。使用图像处理工具箱,我们分析了这些黑白图像,找到了所有BLOB的位置和大小(区域)。

图2。应用阈值和侵蚀程序后的细胞样本图像。

在某些情况下,几个细胞如此靠近,使得其核似乎彼此感动,并且不能像单独的核一样区分。为了增强图像的处理,我们根据其尺寸将BLOB分为三类。具有低于一定尺寸的区域被认为是噪声或部分闭塞细胞,并且从随后的分析中丢弃。中等大小的斑点被归类为已经成功分割的单个核。推测最大的斑点是需要进一步分析的重叠细胞的簇。

为了区分较大斑点内的单个细胞核,该算法裁剪图像中包含最大斑点的子区域,并执行局部自适应阈值,以更准确地区分单个细胞(图3)。

图3。左:未经处理的核簇图像,最初被识别为单个大斑点。右图:重新分析同一簇以确定三个独立的细胞核。

在图像分析过程结束时,该算法已识别图像中大多数小区的位置,并将该数据存储在阵列中。可以通过将输入图像覆盖每个测量的核心位置(图4)来在视觉上验证算法的成功(图4)。

图4。处理后的图像,每个识别的核定位和标记在红色。

测量和分析细胞之间的距离

一旦我们处理了图像并获得了一组细胞核坐标,我们使用基本的MATLAB矩阵运算来计算单个细胞核与细胞簇中所有其他细胞核之间的距离。为了评估单元的散射,我们计算每个单元与其最近邻居之间的距离。每个图像生成一组最近邻距离,每个单元格有一个值。从图像数据中计算出的距离值最初以像素为单位测量,然后使用已知的长度尺度转换为微米。

Matlab这些最近邻距离的直方图清楚地显示了数据适合有意义的分发模式。这些模式显示我们正在研究的四种类型的细胞中的每种细胞之间的明显差异:未处理,HGF处理,OSM处理和HFG + OSM处理的肺癌细胞(图5)。

图5.未处理细胞(左上),HGF处理细胞(左下),OSM处理的细胞(右下)和HGF + OSM处理细胞(右上右)的直方图和曲线拟合。

这些直方图结果表明数据可以使用统计分布表征。使用统计和机器学习工具箱,我们将测量的距离值拟合到一系列概率分布。缩小我们的搜索到不对称,连续分布,经过一个迭代过程,我们发现了loglogistic.分布提供了最近邻距离结果的最佳拟合。

除了表征细胞的散射之外,该项目的主要目的之一是开发一种用于区分通过用不同配体的细胞样品治疗细胞样品产生的散射度的方法。为了实现这一点,我们使用MATLAB来计算用于四个样本中的每一个的逻辑分布的平均(μ)和方差(σ)参数(图6)。

图6.四个最近邻数据集的统计拟合结果。

统计拟合图表明,μ和σ的计算值捕获四个数据集中的细胞散射大小的不同差异。相反,当为给定数据集计算这些参数时,它们可用于识别使用哪种配体(HGF,OSM或HGF + OSM)来治疗原始细胞样本。分布表明,单独的单独散射在细胞中散射,并且组合的配体处理导致散射进一步增加。这些分布反映了用配体处理后我们在细胞中定性地观察到的内容。从这些结果来看,我们得出结论,计算的最近邻距离的LogLoggogistic分布拟合的平均值和方差参数可用于可靠地量化给定样品中细胞核的散射。

除了描述细胞对不同配体的反应外,我们还观察了药物处理对细胞散射程度的影响。我们计算了HGF+OSM处理的样品的逻辑分布,这些样品同时也处理了浓度不断增加的药物,可以阻止HGF的作用(50 nM至2 μM)(图7)。在浓度为500 nM及以上时,该药物抑制了HGF的作用,并将其散射程度降低到与OSM本身的作用近似的程度。这种分析对于确定新药的最佳剂量至关重要。

图7。概率密度函数(PDF)对一系列剂量的最近邻数据的拟合结果。当HGF+OSM和靶向HGF受体(500 nM至2μM)的药物同时作用于肺癌细胞时,结合配体(未经处理vs HGF+OSM)诱导的细胞散射以剂量依赖的方式被抑制。

在EMT量化项目的开始,我们的目标是使用图像分析技术和显微镜数据来量化样品中细胞的散射或密度。在使用MATLAB和图像处理工具箱成功地分析了细胞核的基本属性后,我们意识到结果数据可以最好地按照统计分布进行表征。使用统计学和机器学习工具箱很容易过渡到数据的统计分析。MATLAB使我们能够在单一的开发环境中工作,从初始图像阈值和最近邻距离的计算,通过选择和验证适当的统计分布,到最终比较不同的配体剂量响应。

有了一个用于定量样品中细胞散射的系统,OSI的研究人员现在有了一个客观的计算方法来测量正在开发的药物减少或逆转EMT的能力,并有可能提高药物抑制癌症转移的能力。

关于作者

格雷琴·阿加斯特是OSI制药公司的高级研究科学家,擅长于开发用于药物发现研究的EMT模型和分析,以及用于更高级项目的转化研究。她持有the University of Chicago的生物科学学士学位和the University of Washington的病理学博士学位。

Paul Fricker是一家Mathworks主体咨询工程师。保罗在信号和图像处理,建模和仿真和应用开发中拥有超过15年的经验。他拥有一个b.sc.在达尔霍伊大学的化学中,一个M.SC.在多伦多大学和博士学位的物理学中。马萨诸塞州工业大学的土木工程。

发布于2012 - 92038v00

查看相关功能的文章

查看相关行业的文章