技术文章和通讯

使用图像处理和统计分析来量化细胞对抗癌药物研究的散射

格雷琴Argast, OSI制药有限责任公司,和保罗•弗里克MathWorks


上皮间充质转变(EMT),胚胎发育过程至关重要,与成人癌症的扩散。结果,有兴趣开发抗癌药物,增加目标EMT除了药物目标细胞增殖和生存。

直到最近,测量药物如何影响EMT的一个方面,细胞散射是一个手动过程,涉及主观评估细胞的相对亲密文化。OSI制药研究人员与MathWorks顾问合作,开发一个自动化系统,用于量化细胞样品的散射。基于MATLAB®、图像处理工具箱,统计和机器学习工具原子核和原子距离加权的细胞,系统措施。测量散射的能力是必要的评估药物的疗效可能抑制或逆转EMT因为它为研究人员提供了一个可靠的方法来比较一种药物对另一个的影响。

EMT是什么?

在人类和其他脊椎动物细胞有两种基本类型:上皮和间充质。一些形态和功能特征区分这两种细胞类型。例如,上皮细胞生存依赖于细胞间联系。间充质细胞,相比之下,具有独立于附近的细胞和流动性,两个细胞散射的要求。

在EMT,失去上皮细胞特征和获得间充质特征。EMT对胚胎发育至关重要,因为它产生的间充质细胞可以迁移,形成骨,软骨,在需要的地方和其他组织。在成人中,然而,EMT与疾病如癌症和纤维化有关。因为间质肿瘤细胞更移动,因此更多的入侵,比上皮肿瘤细胞,科学家相信他们方便转移,或肿瘤细胞的扩散。EMT还减少化疗的有效性,目标上皮细胞。

分析细胞样本图像

OSI研究人员已经开发出胰腺癌和肺癌肿瘤模型和识别出一套配体或绑定分子,推动EMT在这些模型。两种配体,肝细胞生长因子(HGF)和制瘤素M (OSM),诱导EMT的模型,使我们能够生产样品演示细胞散射与EMT有关。样品是每个细胞的细胞核染色,以便显示蓝色的图片被我们的显微镜(图1)。

图1所示。未经处理的细胞样本显示细胞核和类似的样本处理HGF和OSM (H + O)。
图1所示。左:一个未经处理的细胞样本显示在蓝色的细胞核。对的:一个类似的示例处理HGF和OSM (H + O)。

量化的散射的细胞,我们开发了一个数值程序,使用图像处理和统计分析。测量细胞的空间密度会相对简单,如果图像被细胞完全覆盖:我们只会计算核的数量在每一个图像,然后除以总图像区域。我们生成的图像是几乎总是部分覆盖,但是,很难正确地估计所需要的细胞密度。我们决定开发一个替代方法量化散射,基于测量细胞核之间的距离。

分析细胞图像,我们使用了一个算法组成的四个主要步骤:

  1. 整个图像阈值分割细胞核,细胞核或集群。
  2. 分析结果斑点以确定其尺寸(地区)。
  3. 放大大斑点进行局部分析,识别单个细胞团内。
  4. 识别(x,y为每个图像中细胞核)的位置。

因为强度比例在所有捕获的图像是一致的,我们可以获取很多的个人使用一个硬编码的斑点阈值。这个阈值过程产生的二进制映像细胞核表示1,或白色,和它的缺席表示0,或黑色(图2)。使用图像处理工具箱,我们这些黑白图像进行分析,以找到所有斑点的位置和大小(地区)。

图2。一个细胞样本图像在应用阈值和侵蚀过程。
图2。一个细胞样本图像在应用阈值和侵蚀过程。

在某些情况下,一些细胞是如此接近,他们的核似乎触摸彼此,他们不能区分作为单独的细胞核。增强图像的处理,我们团分成三个类别,按照它们的大小排序。小于一定尺寸的那些地区被认为是噪音或部分闭塞的细胞,并被丢弃的后续分析。中间大小的气泡被归类为单个核已经成功地分割。最大的气泡被假定是集群重叠的细胞需要进一步分析。

区分个体细胞核内较大的气泡,图像的算法作物条件包含blob和执行本地最大的自适应阈值更准确区分单个细胞(图3)。

图3。未加工的形象一群核最初识别为单个大型blob和相同的集群进行重新分析,以确定三个单独的细胞核。
图3。左:未加工的形象一群核最初被确定为一个大团。右:相同的集群进行重新分析,以确定三个单独的细胞核。

最终图像分析过程中,该算法的位置已经确定图像中大部分的细胞核,并将该数据存储在一个数组。可以验证算法的成功通过覆盖输入图像与视觉标记在每一个测量原子核的位置(图4)。

图4。处理过的图像和每个确定核位于标记为红色。
图4。处理过的图像和每个确定核位于标记为红色。

测量和分析细胞之间的距离

一旦我们处理获得的图像和一个细胞核坐标数组,我们使用MATLAB矩阵运算的基本计算单个核之间的距离和集群中的所有其他核细胞。评估细胞的散射,计算每个细胞和其最近的邻居之间的距离。每个图像生成一组加权距离,每个单元有一个值。距离值计算的图像数据最初以像素,并使用一个已知的长度尺度转换为微米。

MATLAB的直方图加权距离,清楚的说明数据融入有意义的分布模式。这些模式显示明显差异的四个类型的细胞,我们正在研究:未经处理的,HGF-treated OSM-treated、HFG + OSM-treated肺癌细胞(图5)。

图5。柱状图和曲线拟合的最近邻距离未经处理的细胞,治疗胶质瘤细胞,OSM细胞治疗,和+ OSM治疗胶质瘤细胞。
图5。直方图和曲线拟合的加权距离未经处理的细胞(左上),HGF-treated细胞(左下),OSM-treated细胞(右下角),+ OSM-treated胶质瘤细胞(右上角)。

这些柱状图结果表明,数据可以使用统计分布特征。我们使用统计和机器学习工具箱安装距离测量值概率分布。缩小我们的搜索不对称、连续分布,一个迭代过程后,我们发现loglogistic提供最适合最近邻距离分布的结果。

除了描述细胞的散射,这个项目的主要目标之一是开发一个方法区分产生的散射的程度与不同的配体治疗的细胞样本。为此,我们使用了MATLAB计算均值(μ)和方差(σ)参数loglogistic分布的四个样品(图6)。

图6。四个加权统计拟合结果数据集。
图6。四个加权统计拟合结果数据集。

统计拟合图表明,计算值μ、σ捕获细胞的大小散射的截然不同的四个数据集。相反,当这些参数计算对于一个给定的数据集,它们可以被用来识别的配体(HGF、OSM或HGF + OSM)是用于治疗最初的细胞样本。分布表明,要么单独配体诱导细胞散射,而配体相结合治疗导致散射的进一步增加。这些分布反映了我们在细胞治疗后观察定性与配体。从这些结果,我们得出的结论是,loglogistic分布的均值和方差参数拟合计算加权距离可以用来可靠地量化细胞核的散射在给定的样本。

除了描述细胞的反应不同的配体,我们还研究了药物治疗的效果在细胞散射的程度。我们计算loglogistic分布样本处理HGF + OSM也接受的药物浓度增加块HGF的影响(50 nM 2μM)(图7)。在500纳米以上浓度,药物抑制HGF和减少散射的程度的影响,近似OSM本身的影响。这种类型的分析是判定最佳剂量所必需的一种新药。

图7。PDF为最近邻数据拟合效果的剂量范围。
图7。概率密度函数(PDF)最近邻数据的拟合结果的剂量范围。细胞散射诱导肺癌细胞结合的配体(未经处理的vs HGF + OSM)剂量依赖性地抑制时细胞同时治疗胶质瘤+ OSM的受体和药物目标HGF 2μm(500海里)。

初的EMT量化项目,我们的目标是与我们的显微镜使用图像分析技术数据量化散射或密度的细胞样本。成功的基本属性分析后细胞核使用MATLAB的图像处理工具箱,我们意识到由此产生的数据可能最好的统计分布特征。很容易过渡到使用统计数据的统计分析和机器学习工具。MATLAB使我们工作在一个单一的开发环境,从最初的图像阈值和近邻距离计算,通过选择和验证一个适当的统计分布,最后比较不同配体的剂量反应。

为量化系统的散射细胞样本,OSI研究人员现在有了一个客观的测量计算方法的能力减少或反向EMT开发的药物,和潜在的增加药物抑制肿瘤转移的能力。

关于作者

格雷琴Argast高级研究科学家在OSI制药专业发展中EMT模型和药物发现研究化验,以及转化研究更先进的程序。她拥有芝加哥大学的生物科学学士学位和博士学位从华盛顿大学的病理学。

保罗·弗里克是MathWorks主要咨询工程师。保罗拥有超过15年的经验在信号和图像处理、建模和仿真,并应用程序开发。他从达尔豪斯大学拥有一位运筹学理科化学,物理多伦多大学的理科硕士学位,和一个从麻省理工学院土木工程博士学位。

2012 - 92038 v00出版

查看相关文章的能力

为相关行业观点文章