Graphcore降低了第一个戴尔服务器的功耗

2020年3月30日//尼克费海提
第一个Graphcore AI服务器由戴尔公司开发,可提供1.2PFLOPS 2.4kW
第一个Graphcore机器学习服务器,由戴尔开发,提供1.6PFLOPS 2.4kW。

戴尔发布了首款使用Graphcore智能处理单元(IPU)技术的服务器,将16个高性能机器学习处理器整合到一个4U服务器中,提高了电源性能。

DSS8440采用英国布里斯托尔公司开发的技术,连接16个处理器,这些处理器可以运行超过10万个完全独立的程序,所有这些程序都在一个数据中心的机器智能知识模型上并行工作。

新版本在4U机架2.5kW的功率范围内提供1.6PetaFLOPs性能。这比以前基于图形处理器单元(gpu)的设计性能提高了60%,但功耗降低了20%。这可以用于使用Graphcore的杨树开发环境为AI模型的推理训练提供更高的峰值性能,以更少的功耗,或为一半的功耗提供1PFLOP性能。

每个Graphcore ipu有1216个机器学习处理器内核,每个内核运行6个处理器线程,在一个芯片上提供7296个线程。每个IPU-Core都与256kB的快速本地处理器内存紧密耦合。总的来说,IPU大约有300MB的内存,内存带宽为45Tbit/s,没有芯片外内存,以避免内存带宽问题,交付250TFLOPS。每个核心直接连接到IPU-Exchange, IPU-Exchange是位于模具中间的一个可以传输62.5Tbit/s数据的交叉条,通过一个16通道的PCI Express接口连接到主机处理器。

Graphcore C2双槽位PCIe卡中合并了两块IPU芯片。它提供80个ipu -Link,每个Link为32Gbps,总的芯片间带宽约为2.5Tbit/s或450GByte/s。在C2卡上,192GB/s的IPU- link带宽用于连接C2卡本身的两个IPU,而256GB/s的IPU带宽用于连接C2卡。此卡消耗315W电源,并采用被动冷却。

下一个:DSS 8440系统


您êtes确定吗?

如果您有饼干,您就可以在这个网站上找到导航器。

您可以访问être重编者谷歌。

Baidu