麻省理工学院的研究人员正在使用Mathworks工具来推进生物信息学和蛋白质组学。麻省理工学院学生正在使用相同的工具来获得这些领域的动手体验。
在实验室里
Alterovitz和他的研究小组使用了MATLAB®开发分析MS数据的算法,并对由20,000多个节点和100,000条边组成的蛋白质相互作用网络进行建模。每个网络节点代表一个与蛋白质相关的质量,每条边代表节点之间的相互作用。
研究人员还使用MATLAB来可视化与其他生物医学研究人员共享的数据,绘图结果和访问数据库。
由于MS数据类似于声音或语音数据中的一系列峰值和谷,因此研究人员可以应用信号处理技术来处理数据。MIT研究人员使用信号处理工具箱™来处理此MS数据和应用过滤器以消除噪声和无关数据,使它们能够集中在更可管理的数据集上。
Bioinformatics Toolbox™使团队能够从各种互联网资源中快速获取有关蛋白质的信息。该团队使用生物信息学工具箱计算分子量,获得氨基酸序列以及特定蛋白质的其他属性,并将信息下载并解析成MATLAB可访问的数据结构。
麻省理工学院研究人员使用统计和机器学习工具箱™来计算网络属性,包括连接和电力法分布。它们使用用于使用统计和机器工具箱计算样品中蛋白质数量的模型,以简化曲线拟合并产生负二项式,伽马和指数分布。
本集团的研究涉及数百名患者的数百万MS数据点。但是,由于每个患者的数据都是独立的,因此处理信息的任务是对并行化的理想选择。使用并行计算工具箱™和MATLAB并行服务器™,该组在大型计算机上同时执行其MATLAB算法。
该小组在不同的处理器上独立分析每个病人的MS数据。Alterovitz解释说:“并行计算工具箱不仅大大减少了计算时间,还使我们能够快速地对这种方法进行编程。我们没有学习分布式编程,而是使用我们现有的MATLAB代码,并使用并行计算工具箱使其并行。”
该团队还使用了一种分布式方法,通过将网络划分成块并并行运行任务,来加快网络属性和统计数据的计算。
在课堂上
对于生物信息学和蛋白质组学课程,Alterovitz和他的同事教练选择了Matlab的易用性,与其他工具的互操作性,以及在提高抽象水平下提出概念的能力。
“大约90%的课程已经使用了matlab,”艾伦托茨说。“每个人都开始立即使用matlab - 即使是那些没有先前经验的人 - 因为你不需要知道如何编程以便使用它。”
此外,Matlab为学生提供了一种简单的方法来获取和学习在麻省理工学院和哈佛达的领先研究。
该课程的教学方法以阐述理论为基础。它涉及使用一组有限的概念和例子,并逐渐增加复杂性。Alterovitz解释说:“MATLAB本质上支持不同层次的复杂性,通过不同层次的抽金宝app象。在开始阶段,学生运行代码并可视化结果。之后,他们可以探索、更新,甚至将代码与其他编程语言整合,以添加更多细节。”
课程作业还反映了这种方法跨生物水平。学生们首先使用MathWorks工具来分析基本DNA序列信息。然后,它们进展到更复杂的表达数据,蛋白质,并最终使用网络模型在蛋白质和其他分子之间的相互作用。