卡索practicos

麻省理工学院在实验室和教室整合癌症研究

挑战

通过识别蛋白质和分析它们的相互作用来改进癌症诊断技术

解决方案

使用MathWorks工具,学生和研究人员可以分析质谱数据,模拟复杂的蛋白质相互作用,并可视化结果

结果

  • 教育与研究相结合
  • 缩短一个数量级的计算时间
  • 研究资助了

“研究人员通常对结果感兴趣,而不是编程。MATLAB使我们能够在更高的抽象层次上思考,并花费更少的时间来开发、调试、测试和创建图形。因此,我们更快地获得研究结果。”

吉尔·奥特维茨博士,麻省理工学院和哈佛大学
Alterovitz博士介绍生物分子网络。

在早期诊断癌症可以大大提高患者的生存机会。例如,卵巢癌往往在发展到第三或第四阶段后才被发现。对于在第一或第二阶段被诊断出患有这种疾病的患者,五年内存活的几率从不到50%提高到大约95%。

麻省理工学院(MIT)的研究人员和学生正在探索通过检测血液蛋白质来诊断早期癌症的方法。利用MathWorks工具,这些研究人员正在识别只存在于癌症患者体内的蛋白质浓度和蛋白质相互作用,从而实现早期癌症检测。学生使用MathWorks工具学习和贡献研究小组的努力,同时获得知识和经验,以推动未来的生物医学进步。

“在生物信息学领域,两年前进行的研究被认为是过时的。有了MathWorks工具,我们可以让学生参与我们小组今天正在进行的前沿研究,”麻省理工学院/哈佛健康科学与技术分部NIH生物医学信息学研究员Gil Alterovitz博士说。“MathWorks工具使研究小组和学生——包括生物专业和工程师——专注于研究,减少编程时间。”

将复杂的生物分子网络(左)转化为抽象表征(右)的新方法有助于发现和表征其固有成分。

挑战

为了更好地识别可能表明癌症存在的蛋白质,麻省理工学院和哈佛医学院的研究人员,包括Alterovitz、Marco F. Ramoni和Isaac S. Kohane,试图将质谱(MS)结果与蛋白质如何相互作用的知识结合起来。质谱数据包括特征峰和谷,可以通过分析来区分样品中的分子化合物。研究人员需要工具来处理这些数据,并建立一个复杂的模型来表示蛋白质的相互作用。

“我们必须分析包含数百万个数据点的质谱数据,”Alterovitz解释说。“我们还需要建立一个相互作用的生物分子网络模型,进行统计计算,以及对这个网络的属性进行其他分析,并将这些结果与质谱分析结果结合起来。”

在进行这项研究的同时,阿尔特罗维茨还发起并指导了一项新课程,名为生物信息学和蛋白质组学:一种基于工程问题解决的方法.高年级本科生以及研究生一年级和二年级的学生都参加了课程。Alterovitz希望通过一套工具使课程标准化,使学生能够从正在进行的研究中受益,同时也容易学习。

“因为我们有时间限制,我们不想浪费时间教学生一门新语言,”Alterovitz解释说。“我们需要一个大多数学生都已经熟悉的工具,一个生物学家和工程师都能轻松掌握的工具。”
利用MATLAB分析和生成生物网络,通过3D立体眼镜、语音识别和头部跟踪进行交互研究。

解决方案

麻省理工学院的研究人员正在使用MathWorks工具来推进生物信息学和蛋白质组学。麻省理工学院的学生也在使用同样的工具来获得这些领域的实践经验。

在实验室里

Alterovitz和他的研究小组使用了MATLAB®开发分析MS数据的算法,并对由20,000多个节点和100,000条边组成的蛋白质相互作用网络进行建模。每个网络节点代表一个与蛋白质相关的质量,每条边代表节点之间的相互作用。

研究人员还使用MATLAB可视化数据,绘制结果,并访问与其他生物医学研究人员共享的数据库。

由于MS数据类似于声音或语音数据的波峰和波谷序列,因此研究人员可以利用信号处理技术来处理数据。麻省理工学院的研究人员使用信号处理工具箱™来处理这些MS数据,并应用滤波器来消除噪声和无关数据,使他们能够专注于更易于管理的数据集。

Bioinformatics Toolbox™使团队能够从各种互联网资源中快速获取有关蛋白质的信息。该团队使用生物信息学工具箱计算分子量,获得氨基酸序列以及特定蛋白质的其他属性,并将信息下载并解析成MATLAB可访问的数据结构。

麻省理工学院的研究人员使用统计学和机器学习工具箱™来计算网络属性,包括连通性和幂律分布。他们使用统计学和机器工具箱的模型来计算样本中蛋白质的数量,以简化曲线拟合并生成负二项分布、γ分布和指数分布。

该小组的研究涉及数百名患者的数百万MS数据点。然而,由于每个患者的数据是独立的,处理信息的任务是理想的并行化。使用并行计算工具箱™和MATLAB并行服务器™,该小组在一个大型计算机集群上并发地执行他们的MATLAB算法。

该小组在不同的处理器上独立分析每个病人的MS数据。Alterovitz解释说:“并行计算工具箱不仅大大减少了计算时间,还使我们能够快速地对这种方法进行编程。我们没有学习分布式编程,而是使用我们现有的MATLAB代码,并使用并行计算工具箱使其并行。”

该团队还使用了一种分布式方法,通过将网络划分成块并并行运行任务,来加快网络属性和统计数据的计算。

在教室里

在生物信息学和蛋白质组学课程中,Alterovitz和他的课程指导伙伴选择了MATLAB,因为它易于使用,与其他工具的互操作性,以及在不断提高的抽象水平上呈现概念的能力。

“大约90%的学生已经使用过MATLAB,”Alterovitz说。“每个人都立即开始使用MATLAB——即使是没有经验的人——因为你不需要知道如何编程就能使用它。”

此外,MATLAB还为学生提供了一种简单的方法来访问和学习在麻省理工学院和哈佛大学进行的领先研究。

该课程的教学方法以阐述理论为基础。它涉及使用一组有限的概念和例子,并逐渐增加复杂性。Alterovitz解释说:“MATLAB本质上支持不同层次的复杂性,通过不同层次的抽金宝app象。在开始阶段,学生运行代码并可视化结果。之后,他们可以探索、更新,甚至将代码与其他编程语言整合,以添加更多细节。”

课程作业也反映了这种方法在生物水平上的应用。学生们首先使用MathWorks工具分析基本的DNA序列信息。然后他们发展到更复杂的表达数据、蛋白质,最终使用网络模型研究蛋白质和其他分子之间的相互作用。

结果

  • 教育与研究相结合.“有了MATLAB,我们可以为学生提供我们组和其他组的最新代码和研究结果,”Alterovitz说。“有了他们获得的经验,学生们可以协助研究小组,为我们的努力做出贡献。”

  • 缩短一个数量级的计算时间.“使用MATLAB代码的分布式方法,我们在一个计算机集群上运行我们的分析,并将计算时间减少了一个数量级——从大约一周减少到远远少于一天。这是至关重要的,因为我们面临着会议的最后期限,而结果在我们的工作被接受方面发挥了关键作用,”Alterovitz说。

  • 研究资助了.“在完成课程后,一名生物学专业的学生在下个学期加入了我的研究小组,并获得了麻省理工学院本科生研究机会计划的资助,”Alterovitz说。“有了MATLAB,他很快就变得非常高效,并及时得到结果,申请了拨款;否则这是不可能的。”

麻省理工学院是世界上提供MATLAB和Simulink校园访问的1300所大学之一。金宝app通过校园范围许可,研究人员、教师和学生可以访问最新版本的产品的公共配置,以便在教室、家中、实验室或实地使用。下载188bet金宝搏