目标:人工智能、云计算与高性能计算,amd推出全球首款7nm数据中心gp
2018-11-07 16:44来源:零镜网//
原标题:目标:人工智能、云计算与高性能计算,amd推出全球首款7nm数据中心gp
在amd“跑步进入7nm时代”的行动中,gpu扮演了开路先锋的角色。在今天召开的next horizon技术大会上,amd就宣布了全球首款7nm制程gpu产品:主要用于人工智能、云计算和高性能计算的amd radeon instinct mi60和mi50数据中心gpu。mi是machine intelligence的缩写,可以很清晰地反映amd radeon instinct产品线的定位。
在看到竞争对手凭借专业计算卡在人工智能和高性能计算领域混得风生水起后,amd在一年多前正式推出了radeon instinct系列,用以取代之前的firepro s。而在今年,radeon instinct随着7nm制程的升级也进行了产品升级,从之前的mi25升级为mi60和mi50。
我们先来看看amd radeon instinct mi60和mi50的具体指标。从现场展示的ppt来看,mi60和mi50的规格差距并不大,二者的计算单元数量分别为64个和60个,流处理器数量分别为4096个和3840个。
mi60和mi50依然是基于vega gpu架构,但是amd在采用7nm制程工艺的同时,对其核心架构进行了部分优化升级。比如优化了alu算术逻辑单元,也增加了ecc完全校验功能,采用pcie 4.0接口标准等。
其核心规模从14nm vega 10的125亿晶体管增加至7nm vega核心的132亿晶体管,不过因为其制程工艺的提升,核心面积从484平方毫米降低到了331平方毫米。同时其核心尺寸仅相当于竞争对手的大约40%,因此mi60和mi50在部署成本和密度方面具备相当的优势。
相比之前的mi25,mi60将内存带宽提高到了夸张的1tb/s,集合32gb hbm2存储,其数据单款基本达到了顶峰。同时,其还实现了包括gpu和存储在内的全面ecc校验,以及pcie 4.0接口。
架构的优化、制程的提升以及存储带宽的扩大,使得mi60可以提供强大的混合精度fp16、fp32和int4/int8能力,从而满足动态工作负载的需求,特别是从训练复杂神经网络到运行针对这些训练网络的推理。同时,mi60还是目前世界上最快的双精度pcie 4.0加速器,提供了高达7.4tflops的峰值fp64性能,能够更有效地处理包括生命科学、能源、金融、汽车、航空航天、学术、政府、国防等行业的高性能应用。
相比mi25,mi60的fp16浮点性能提高了20%,int8、int4整数性能分别提高了140%、380%。凭借在int8和fp64方面的性能改进,amd得以将其radeon instinct产品线的应用场景从mi25时代的神经网络训练和虚拟化,扩展到了推理计算和高性能计算领域。
另外,通过pcie 4.0接口和infinity fabric link gpu互连技术,amd可以通过硬件桥接的方式,实现八张加速卡分成两组的彼此互联。通过桥接,mi60可以实现高达6倍的快速数据传送,每个gpu的两个infinity fabric链路拥有多达200gb/s的对等带宽。
而在8张加速卡可以基于硬件虚拟化实现灵活组合,从一张加速卡支持16个虚拟机,到一台虚拟机拥有8张加速卡。
同时,其组合方式也非常灵活。1台服务器内拥有的8张加速卡可以采用灵活分组的方式,配置成为拥有1张、2张、4张以及8张加速卡的虚拟机。
来源:搜狐
以上是网络信息转载,信息真实性自行斟酌。












)







