文件交换的选择

我们最好的用户提交

画一个极地系统树图

本周的选择画一个极地系统树图通过山姆·罗伯茨

如果我没有选择航空航天工程事业,遗传学是一个明智的选择。近年来,它已经成为我的其中的一个特殊的爱好。我认为大数据集的结合,人类历史的统计方法,吸引我。

几年前,我决定在我的基因Y染色体检查。坎贝尔的细节我的血统在1800年左右成为黑暗,我不能告诉你我是如何与绝大多数人叫坎贝尔在世界各地。代替书面记录,我很好奇,如果DNA测试将显示任何与阿盖尔郡公爵的通用性,坎贝尔的氏族。果然,我们的结果是相同的。值略有不同,由于突变积累了一代又一代,但他们足够接近表明它没有侥幸,我们有相同的姓氏。

提供的服务进行分析统计估计的时间公爵,我拥有共同的祖先。而不是以估计的表面价值,工程师/遗传学爱好者在我想理解他们是如何计算出来的。虽然这是一个有趣的话题,这里的细节不值得探索。我只想说,我写了MATLAB代码产生概率曲线,当两个人拥有共同的祖先。

完成这几个月后,我发现我可以推进这个概念进一步运用团体而不是个人。我提取峰值每两个人之间的概率分布。这使我能够创建一个矩阵的遗传距离,我叫模式。第一行和第一列显示预期数量的个人将他从其他小组成员。2行2列显示成员2人的距离,等等。

遗传距离矩阵模式


几行代码,我能够重塑这个距离向量,供应统计工具箱函数链接瞧,创建一个系统树图。实际上,我有一个家族树显示,当不同的苏格兰氏族分化。(我把一些爱尔兰的名字了)。

系统树图的代码

系统树图的苏格兰家族亲缘使用加权Y染色体采样数据的链接


就像我说的,我不是专家在这个问题上,因此我不知道这张图是多么准确。我可以告诉你,当我改变度量参数的联系,得到完全不同的结果。但即使细节并不完美,我似乎是在正确的轨道上。所有的厨集群在一起如你所愿。五人分开大约1600左右,而另一个中断在公元1000年左右。每个人的共同祖先是大约60代之前,这是在罗马人放弃了英国。然而,这可能是误导性的因为我的分析不考虑的可能性回突变

最后,我们来选择。这样的图很有趣,但有什么办法可以让它更令人兴奋的呢?这正是山姆已经想出如何做。他提交上显示一个dendogram极地投影。他雇佣的代码是简单和容易理解,足以让我感到舒适的十分钟内做出改变(我更新了标签显示姓氏)。所以即使很长时间(代码已经用于5 +年),祝贺山姆好工作!

极地系统树图的苏格兰家族亲缘使用加权Y染色体采样数据的链接


评论
让我们知道你的想法在这里或者离开评论山姆。
|
  • 打印
  • 发送电子邮件

评论

留下你的评论,请点击在这里MathWorks账户登录或创建一个新的。