英特尔超立方体,第1部分

即使我是MathWorks的创始人之一,我只是作为一个顾问公司首次五年。在此期间,从1985年到1989年,我在我的运气和两个硅谷电脑创业公司。企业失败的企业,但经验教会我很多关于计算机行业,和我如何看待MATLAB的最终发展的影响。第一个创业公司开发了英特尔超立方体。

内容

加州理工学院的宇宙立方

1981年,加州理工学院的教授查克·塞茨和他的学生开发了世界上第一个并行计算机,他们称之为宇宙的多维数据集。有64个节点。每个节点是一个单板计算机基于英特尔8086 CPU和8087浮点协处理器。这些芯片被用于IBM个人电脑。有宇宙立方的房间在黑板上只有128 kb的内存。

塞茨的团队设计了一个芯片处理节点之间的通信。这不是可行的节点直接连接到每个63其他节点。这将需要连接^ 2 = 4096 64美元。相反,每个节点连接到只有六个其他节点。只需要6 \ * 64 = 384美元连接。用二进制表达每个节点的地址。因为有2 ^ 6节点美元这需要六位。一个节点连接到节点的地址相差一点。这个对应的节点作为一个六维立方体的顶点和连接边缘的多维数据集。所以,这些机器被称为“超立方体”。

图形显示了16个节点在一个四维超立方体。每个节点连接到其他四人。例如,使用二进制、节点0101连接到节点0100,0111,0001,1101。

加州理工学院的教授杰弗里·福克斯和他的学生开发的应用程序的数据集。第一批项目的分支称为量子色动力学的高能物理(量子色)和工作在天体物理建模星系的形成。他们还开发了一个强大的代码来下棋。

硅森林

我加入了第一次创业不是在硅谷,但是在一个后代在俄勒冈州的支持者称为硅森林。到1984年,英特尔一直在扩大其业务外加利福尼亚和俄勒冈州已经开发了一个相当大的存在。英特尔的创始人之一戈登•摩尔,然后它的CEO,是加州理工学院的校友和董事会。他看见一个演示的宇宙立方在董事会会议上,决定,英特尔应该开发一个商业版本。

两个小组英特尔的工程师已经离开了公司,形成创业公司在俄勒冈州。的共同创始人之一的公司之一是约翰·帕尔默是我以前的学生,的作者之一IEEE 754浮点标准。帕默的公司,名叫斯•已经开发一个商业超立方体。

希望说服更多的中止初创公司,英特尔在俄勒冈州比弗顿的形成两个“intrepreneurial”操作,俄勒冈州波特兰附近。维基百科词典定义内部企业家精神“表现得像一个企业家工作时在一个大型组织。”Justin Rattner was appointed to head one of the new groups, Intel Scientific Computers, which would develop the iPSC, the Intel Personal Supercomputer.

加州大学伯克利分校教授Velvel卡亨,是(现在仍然是)我的一个好朋友。他一直与英特尔(和帕尔默)浮点标准的发展和8087年的浮点芯片。他建议英特尔招聘我加入iPSC集团,他们做到了。

在1984年的时间,我已经新墨西哥大学的计算机科学系主席近五年。我没有看到我的未来在学术管理。我们刚刚成立了MathWorks,但杰克小很能够处理。我很激动参与创业的前景和学习更多关于并行计算。所以我的妻子、女儿和我搬到俄勒冈州。这涉及到开车经过拉斯维加斯和我描述的故事盆栽棕榈博客文章。

分布式阵列

我开车在内华达州对俄勒冈州北部,是数百英里从任何计算机,工作站或网络连接。我可以认为。我想到了我们应该如何做矩阵计算分布式内存并行计算机当我们让他们工作。我知道宇宙立方的家伙加州理工学院打破了矩阵成子矩阵像细胞的偏微分方程。但LINPACK EISPACK和我们的羽翼未丰的MATLAB存储矩阵的列。如果我们保存这一列的组织,这将是更容易产生并行版本的一些项目。

所以,我决定创建分布式处理数组的列(比如他们从一副扑克牌。如果有p处理器,然后列j数组的将存储在与身份证号码国防部处理器(j,p)。

高斯消去法为例,将以以下方式进行。在k消除的th一步,节点了kth列会搜索最大的元素。这是kth枢轴。后列中的所有其他元素除以主产生乘数,将包含这些乘数的广播一条消息到所有其他节点。然后,在需要大多数的算术运算的步骤,所有节点将运用乘数列。

这种面向列的方法可以用来生产关键矩阵算法的分布式内存并行版本LINPACK EISPACK。

英特尔个人超级计算机

介绍1985年,iPSC可用在三个模型,d5, d6,和d7, 5, 6, 7-dimensional超立方体。d5有32个节点在一个内阁图。d6有64个节点的两个柜,和四个柜d7有128个节点。列表价格范围从17万美元到超过一百万。

每个节点有一个英特尔80286 CPU和80287浮点协处理器。这些都是在IBM PC /使用的芯片,的“先进技术”个人电脑可用的最快。有512 kB,半个字节,内存。一个定制的芯片处理超立方体与其他节点通信,通过底板在内阁和内阁之间通过以太网。

可以一半的节点替换为董事会填充内存芯片,4字节/板,给每节点4.5 mb。,会把一位内阁变成d4共有72字节的内存。一年后的另一个变体是宣布董事会向量浮点处理器。

前端计算机称为多维数据集管理器是一个Intel-built在微机PC / 4 mb的内存,140兆字节的磁盘,VT100-compatible“玻璃电传打字机”。经理直接以太网连接的所有节点。我们通常从工作站通过远程登录访问我们的桌子。经理跑XENIX, UNIX系统III的导数。有Fortran和C编译器。我们将编译代码,构建一个可执行映像,并下载到多维数据集。

有一个最小的操作系统多维数据集,它处理节点之间的消息传递。节点之间发送的消息,并没有直接连接在超立方体互连必须通过中间节点。我们很快就有库函数,包括操作,比如全球广播和全球总和。

的灯

如果你仔细观察图片,你可以看到红色和绿色发光二极管在每个板。这些灯被证明是非常有用的。当节点上的绿灯是在做有用的计算和节点时红灯在等待有关。你可以看灯和了解工作是如何做的,甚至一些效率的概念。

有一天我在看灯的机器上,我能够说“有毛病节点7。它与其他的不同步。”We removed the board and, sure enough, a jumper how been set incorrectly so the CPU's clock was operating at 2/3 its normal rate.

在我的建议,后面的模型有一个第三,黄色,当时光时所使用的数学协处理器。这样可以了解算法的性能。

第一个客户的船

在电脑制造业务,第一个客户船的日期,或FCS,是一件大事。这就像一个孩子的诞生。我们的第一个客户是耶鲁大学计算机科学系,事实上,他们已经下令d7, 128年大,节点机器。预定FCS日期临近时,机器没有完全准备好。我们有比尔Gropp,耶鲁大学的研究生,主要研究人员在他们的计算机实验室,从康涅狄格飞到俄勒冈州和花几天在我们的计算机实验室。所以FCS好了,但客户的,而不是设备。

星球大战

在这段时间里,罗纳德•里根(Ronald Reagan)总统的政府已经提出了战略防御计划,SDI。这个想法是利用地面和太空导弹保护美国免受攻击导弹。这个提议已经被批评者的“星球大战”系统。

国防承包商的工作之一SDI相信分散,并行计算是指挥和控制系统的关键。如果是分散的,那么它不能摧毁了一个打击。他们听说我们的新机器,要求演示。Rattner,我,我们的市场部负责人去他们的办公室在五角大楼附近。我们被领进一间会议室,我所见过的最大的会议桌上。大约有30人,其中半数在军服。灯光昏暗,因为发生了幻灯片。

我中途我的演讲关于如何使用iPSC当一个年轻的空军军官中断。他说,“硅藻土,硅藻土,我记住你的名字从某个地方。”I start to reply, "Well, I'm one of the authors of LINPACK and ..." He interrupts again, "No, I know that... It's something else." Pause. "Oh, yeh, nineteen dubious ways!" A few years earlier Charlie Van Loan and I had published "Nineteen dubious ways to compute the exponential of a matrix." It turns out that this officer had a Ph.D. in Mathematics and had been teaching control theory and systems theory at AFIT, the Air Force Institute of Technology in Ohio. So for the next few minutes we talked about eigenvalues and Jordan Canonical Forms while everybody else in the room rolled their eyes and looked at the ceiling.

预览的第2部分

在我下一篇文章里,第2部分,我将描述这台机器,iPSC / 1,影响MATLAB,和更广泛的社区技术计算。

参考

加州理工学院的宇宙立方




发表与MATLAB®R2013b

|

评论

留下你的评论,请点击在这里MathWorks账户登录或创建一个新的。