英伟达最新的超级计算机就像盒子里的数据中心
让开点,华生——如果你还没有的话。英伟达公司刚刚发布了DGX-1,这是“世界上第一台深度学习超级计算机”,它建立在公司新发布的Pascal架构之上。
DGX-1的设计目的是通过应用gpu加速计算来为企业的机器学习和人工智能工作提供动力,其吞吐量相当于运行Intel Xeon处理器的250台服务器的吞吐量。
具体来说,DGX-1有8块16GB的特斯拉P100显卡,可以产生170万亿次浮点运算,即每秒170万亿次浮点运算。相比之下,虽然IBM的沃森超级计算机是为不同的目的而建造的,但它的浮点运算速度达到了80万亿次。
Nvidia首席执行官兼联合创始人黄仁勋在GPU技术大会(GTC)的主题演讲中说:“这就像一个盒子里有一个数据中心。”
黄以训练AlexNet为例,AlexNet是多伦多大学毕业生Alex Krizhevsky开发的一种流行的计算机图像识别神经网络。这些神经网络必须经过强大的计算机的“训练”,才能正确识别图像——或者不管它们的主要功能是什么——靠自己。
对于运行在Intel Xeon芯片上的250台服务器,这将花费150个小时的计算时间。DGX-1仅用一簇特斯拉P100芯片就可以在两小时内完成这项工作。
坦率地说,这对研究人员在人工智能、3D制图甚至更好的谷歌图像搜索中更快速地测试他们的发现的能力产生了令人震惊的影响。至少在英伟达明年再次以10倍的优势超越自己之前是这样。
(DGX-1的能力是Nvidia之前在2015年GTC大会上发布的基于gpu的超级计算机的12倍。)
Nvidia最新的图形处理架构Pascal是以另一位著名的科学贡献者的名字命名的,它的第一个家是DGX-1,即Tesla P100数据中心加速器。该系统加速器,自然是基于Nvidia的帕斯卡GP100 GPU。
Pascal不仅在以前的Maxwell体系结构的基础上增加了更多的东西,而且还提高了它的效率。例如,Pascal芯片的流多处理器(SMs)中CUDA计算核心的数量是之前型号的一半:64个CUDA核心和4个纹理单元。(这为GP100提供了3840个计算核心和240个纹理单元。)
但是,由于Pascal包含的SMs比以前多了一倍多,因此它比以前的几代更强大。
简而言之,运行在以pascal为动力的Tesla P100上的超级计算机或服务器可以比以前做更多的事情,这意味着更小(或至少更高效)的数据中心,以及更容易接近的神经网络和人工智能开发。
黄预计,2017年第一季度,IBM、惠普企业(Hewlett Packard Enterprise)、戴尔(Dell)和Cray将推出服务器,其中一台的零售价为12.9万美元(约合91,130英镑,约合171,161澳元)。
帕斯卡对你我这样的人意味着什么?好吧,今年晚些时候,我们可以期待看到消费级图形芯片的另一次飞跃,它可能专注于为真正高质量的虚拟现实提供更有效的支持,而不是向它扔几个大家伙,然后就此打住。