技术文章和通讯

加速发展的一个新的单分子定位和跟踪技术

法师f . Serag,阿卜杜拉国王科技大学


开创了30多年前,单分子定位和跟踪(SMLT)是一种用于描述单个分子的运动的技术。通过测量扩散系数和描述分子随机运动,定向,或限制,科学家可以研究活细胞亚细胞动力学,包括病毒感染、基因转录、细胞表面受体的行为。

尽管它相对悠久的历史和许多应用程序,SMLT有几个缺点。例如,它没有告诉我们分子的形状和大小或如何随时间变化的。此外,SMLT是低效的,有时不能工作由于统计误差造成的失焦运动分子。

我的研究小组在阿卜杜拉国王科技大学(KAUST)开发了一种测量单分子扩散的方法,没有这些限制。而不是量化分子扩散的时空组件的轨迹,在传统SMLT, MATLAB®基于方法量化扩散通过分析累积面积的增加(CA)的分子在空间(图1)。我们验证方法和MATLAB进行比较计算扩散系数的统计分布传统SMLT与新CA技术和计算方法。CA方法优于传统SMLT可测量DNA分子的扩散动力学测试。

KAUST_fig1_w.jpg
图1所示。增加所占据的累积区域荧光团簇在0.48秒(上)和DNA荧光染色0.4秒(底部)。

我们工作的核心——图像处理和对显微镜图像进行拟合和数学计算使用MATLAB完成。MATLAB提供的三个关键优势使它适合我们的研究。首先,它很容易学习。尽管我的背景是在药房,而不是编程,我很精通MATLAB进行这项研究在短短一个月。它可能会花费我六倍的时间达到类似水平的掌握语言(如c++或Java)®。第二,KAUST总学术员工(发)许可证,使得研究人员在KAUST更容易访问MATLAB和大量的能力和功能的附加工具箱在校园的任何地方。第三,SMLT和CA方法的运算量,需要成千上万的高斯配件为一个实验。并行计算工具箱™和MATLAB并行服务器™使我加快这些方法为多个实验,缩短处理时间从几天到几个小时(参见侧栏)。

创建模拟粒子的图像序列、团簇和DNA分子

SMLT和CA方法涉及分析的图像帧序列,通常与一个或多个从显微镜捕获,分子在每一帧。我们应用CA方法来描述粒子的运动,并计算扩散系数三个独立的场景。第一个使用模拟数据创建的图像序列。第二个和第三个获得的图像序列使用在我们的实验室中使用一个定制的宽场荧光显微镜数字化。

我们设计了第一个场景验证CA方法。在MATLAB中,我们生成的随机游走粒子的轨迹在二维空间中使用预先确定的扩散系数为1.0,1.5和2.0 micrometers2 /秒。每一步的随机游走,粒子的x和y位置被用来定义一个five-pixel十字架的中心的单帧图像序列(图2)。然后,我们使用CA方法模拟粒子的扩散系数,计算并验证结果(1.10,1.51,和1.98 micrometers2 /秒,分别)在协议与我们的预定值。

KAUST_fig2_w.jpg
图2。累积区域模拟二维扩散轨迹。在0秒,模拟粒子在原来的位置,由five-pixel十字架。

对于第二个和第三个场景,我们跟踪的黄色荧光聚合物簇直径约0.2微米、双链DNA分子的不同长度和拓扑形式。我们捕获的图像团簇和分子的速度1帧/ 6.4 ms。我们使用SMLT和CA方法处理这些图像。

实现CA方法

在MATLAB工作,我们开发了一个算法来实现CA方法(图3)。使用成千上万的512 x 512像素的帧序列生成的在实验室里通过模拟或被俘,算法首先调用图像处理工具箱™函数基于初始阈值去除背景。算法计算合适的频率分布这个阈值的帧中所有像素的强度与高斯函数使用曲线拟合工具箱™。

算法去除噪声像素的帧后,逐渐增加了背景阈值直到5像素依然存在,占用的空间的面积定义分子框架。

当所有帧序列中的处理,添加他们的算法生成分子所占据的累积区域在每一帧,然后减去累计区相邻帧找到累积区不同,用于计算扩散系数。

KAUST_fig3_w
图3。CA方法的一系列步骤,包括背景减法、噪声去除、叠加,计算累积面积的差异,和扩散系数的计算。

加速过程的并行和分布式计算

用一个实验要求大约200000高斯配件,我们很快就发现,在单处理器上运行实验实际花了太长时间。缩短处理时间我们使用并行计算工具箱进行计算与多核工作站。用四核的实验花了三个小时,和16个核心,45到50分钟。

当然,我们经常需要运行许多仿真和实验来获得有效的统计结果。进一步加速运行的过程中,我们开始我们的工作在512一次核研究计算集群与MATLAB KAUST并行服务器。这些集群提供超过10000个核心用户。使用这个设置我们可以完成一系列实验,在多核机器上在短短24小时15分钟。

可视化和解释结果

我们正在解释我们的模拟和实验的结果。我们与MATLAB可视化实验结果更好地理解与SMLT相比CA-method是如何执行的。

启用的比较与传统SMLT CA-method在同一实验数据,我们实现了在MATLAB SMLT。我们SMLT算法适用于二维高斯配件在每一帧的像素来确定分子的质心的位置。重复这个过程每一帧后,算法大规模跨帧连接中心创建一个轨迹,然后执行轨迹的平均平方位移分析的描述分子的运动(图4)。

KAUST_fig4_w.jpg
图4。单个荧光nanosphere随机运动的解决方案。粒子的运动跟踪使用SMLT和MATLAB。

我们使用动态时间规整(DTW)技术在MATLAB中实现测量SMLT和CA-method结果之间的异同。初步结果表明,该CA-method统计误差较小,除了能够为科学家提供分子构象变化的规模和频率的信息。

在研究计算集群上运行MATLAB

Matthijs van Waveren博士,KAUST研究计算

MATLAB并行服务器允许研究员KAUST计算机集群上运行计算密集型MATLAB项目养护和管理大学的研究计算组。

为了方便研究人员使用集群,我们组和MathWorks一起工作®咨询公司开发一个高性能计算(HPC)附加MATLAB。研究人员可以使用这个插件在MATLAB环境中执行脚本数百名工人。插件负责传输数据文件和脚本到集群,运行工作,然后将结果返回给研究者的MATLAB环境。

HPC插件使研究人员更容易使用集群进行MATLAB的工作。因此,对集群的需求急剧增加。为了满足这种需求,我们建立了一个虚拟集群使用Linux OpenStack和一组®工作站。然后,我们更新了HPC插件,以便用户可以运行工作的原始集群或新的虚拟集群。虽然不是原始集群一样快,可用的虚拟集群研究人员不愿意等待他们的工作安排在原始时期集群的高需求。

作者希望感谢雷蒙德·诺里斯和胺的El Helou MathWorks协助发展HPC插件

关于作者

法师博士Serag KAUST博士后研究员。他正在新单分子荧光成像技术的可视化同时扩散和DNA构象动力学。Serag博士持有博士学位在日本名古屋大学的化学和生物技术。

Matthijs van Waveren博士是研究应用专家KAUST有超过20年的经验作为一个软件工程师,研究员,超级计算机顾问,和营销协调员。

2016 - 92970 v00出版

查看相关文章的能力

为相关行业观点文章