在SC 2012超级计算机国际会议上,AMD、NVIDIA以及Intel展示的都是高性能HPC解决方案,无论是基于GPGPU还是基于X86架构的加速卡比拼的都是性能,不过低功耗的ARM处理器也不是没有露脸的机会。
一家名为Seco的公司推出的加速卡使用的是ARM SOC处理器,名叫Carma Devit,而意大利公司E4Company则以此为基础推出了8到24片阵列组成的HPC解决方案。
Carma Devkit源于NVIDIA的Project Carma,其实Seco出售的Carma套件就是NVIDIA提供的,通过ARM处理器加Quadro芯片的形式组成一个加速卡,具体来说就Tegra 3处理器搭配Qyadro 1000M加速卡。
E4的每个计算机簇由8块Carma组成,使用520W电源,最大计算能力为2.16TFLOPS(8个Quadro 1000M),尚不足一块Tesla K20X计算能力的一半,因为Quadro 1000M只有96个CUDA核心,270GFLOPS的浮点运算能力,而且搭配的CUDA 2.1只支持单精度运算,不具备FP64双精度运算能力。
E4提供的HPC阵列由12个节点组成,每个节点搭配一块Carmar主板和2个Quadro 1000M加速卡,总计算能力为6.48TFLOPS,搭配1500W电源。另外,E4还提供纯粹由Tegra 3处理器组成的加速卡,每个主板有48个Tgera 3核心,总计192个ARM内核,只要搭配400W电源就行了。
这套系统让人想起了什么?NVIDIA的希望之星Project Denver就是这样的形式,只不过集成度更高,集成ARM内核+GeForce显卡内核,一个芯片就可以实现目前需要的CPU+GPU两部分组成的加速方案。
Project Carma目前的性能还是很低,因为使用的Tegra 3+Quadro 1000M加速卡都是低成本、低功耗属性的,并不追求性能,但是未来的Project Denver将使用最新的GPU核心和64位ARM内核,性能相比目前的方案会有极大提升。
欧盟的超级计算机计划
目前欧盟已经投资810万欧元实施Montblanc计划,预计在2017年造出计算能力达到200PFlops的超级计算机,性能是最近Top500排名第一的Titan的10倍。该计划的原型就选择了三星的Exynos 5处理器,因为它是目前唯一一个Cortex-A15架构的ARM处理器,性能大幅领先其他Cortex-A9处理器的。