文选流氓 发表于 2004-5-11 18:29

[转贴]用Linux和廉价硬件的超级计算机获巨大进展

(Linuxbyte.net 5月11日 转载 计算机世界网)最近安装在劳伦斯-利弗莫尔国家实验室的超级计算机Thunder可能是全球运算能力第二强的超级计算机,它是由加利福尼亚数字公司开发的。

        位于硅谷边缘的加利福尼亚数字公司有55名员工,Thunder有1024台4路安腾2服务器组成,能够完成各种各样的任务,每秒钟19.94万亿次的运算能力使得它在“超级计算机500强”排在第二位。


        许多人感兴趣的是,Thunder使用Linux操作系统将相对廉价的现成硬件“捆绑”起来,建成运算功能相当强大的超级计算机。Thunder价值数百万美元,但与具有相当运算能力的传统超级计算机相比,它的价格仍然低了约三分之一。

        加利福尼亚数字公司的总裁道格拉斯说,一线厂商没有更多地介入这一市场。其它一些小公司也进入了该市场。例如,Linux网络公司正在为洛斯阿拉莫斯国家实验室研制二台基于AMD公司的Opteron处理器的机群式超级计算机:一台配置有2816个处理器的机群系统将用于研究核武器的贮存,另一台配置 512个处理器、规模较小的机群系统则专门研究其它相对简单的问题。另外,该公司还在为美国的陆军研究实验室研制一台由2132个至强处理器组成的机群系统。其它涉足该市场的公司包括ProMicro、Optimus和Verari,部件厂商Mellanox和SuperMicro也加入了该市场的竞争。

        技术先进和价格有吸引力使得由IBM、克雷、NEC等公司生产的使用了专有软、硬件技术的传统超级计算机受到了冷遇。尽管象NEC公司研制的“地球模拟者”这样的超级计算机适合完成象天气预报这样的任务,但研究人员发现,大多数应用能够在由2、4路服务器组成的机群系统上完成。

        这些机群系统合同中的大多数仍然落入了IBM、戴尔、惠普等大公司的囊中,但不可否认的是,小公司也获得了一些重要的合同。

        研究机构对这类系统越来越精通减少了实现系统所需要的时间和成本。例如,劳伦斯-利弗莫尔国家实验室就聘请了自己的Linux内核和编译器专家来加快向机群系统的移植。该实验室的负责先进技术的副主任马克说,我们采购的不是解决方案,而是单个的部件。这样能够使我们获得高2-3倍的性价比。

        尽管核心服务器是使用标准部件建造的,但进入该市场还需要复杂的专门技术。Linux网络公司帮助客户决定需要使用多少个处理器和内存,以及在 InfiniBand、GigabitEthernet、QSNet、MyriNet中哪种互联技术最合适,然后自己对服务器进行组装和测试。

        软件在机群式超级计算机合同中占有重要的地位。Linux网络公司的创始人、CEO伯纳德说,系统价值中越来越多的部分来自在硬件系统上运行的软件。

        道格拉斯说,在软件如何运行以及消除网络延迟方面,我们还有相当多的东西需要了解。搞不清楚机群系统复杂性没有技术上的原因,但它要求低延迟、管理工具和其它方面的积累。

        除了技术外,这些小公司还得到政府机构的支持。马克表示,作为政府机构,我们必须向小企业提供帮助,这是我们应该做的。

        据IBM公司“深计算”团队的负责人戴夫称,机群系统的问世已经有15年了,最近几年的变化是它可以使用运行Linux的AMD、英特尔处理器,以及使用了标准的互联技术。许多人认为这一转折是在1999年和2000年开始的。当时,价格相对低廉的英特尔公司的处理器在性能上超过了RISC处理器。 Linux和Beowulf机群技术也越来越普及了。

        劳伦斯-利弗莫尔国家实验室在1990年代末研制了其第一台Linux-英特尔机群系统,该系统使用的是PII处理器,但马克说,劳伦斯-利弗莫尔国家实验室当时就清楚这一技术会不断发展。通过将数据传输速率由每秒钟800MB提高到每秒钟2.4GB,Pentium4处理器的使用对于劳伦斯-利弗莫尔国家实验室是一个分水岭。

        要进入这一市场并非易事。英特尔公司的多处理器平台营销主管詹森说,企业不仅仅需要掌握相关技术,它们还必须学会如何竞标,如何执行政府合同。另外,该市场上的另一个特点是各种计算项目的秘密性。但是,尽管存在困难,但这些公司的增长机遇还非常强劲。
页: [1]
查看完整版本: [转贴]用Linux和廉价硬件的超级计算机获巨大进展