因为chatgpt点起来的ai大模型这把火,已经连着烧了好几个月了。每当人们觉得差不多卷到头了的时候,就会有大厂跳出来再给这把火添点柴。互联网大厂卷完,轮到芯片厂了。
这不,英特尔近日公开了自己的aurora genai模型,据称参数量高达1万亿。
给超算准备的大模型
用英特尔自己的话来说,aurora genai由英特尔、hpe和argonne联手开发。未来将用于科学计算领域,包括生物学、癌症、大气科学、天文学、高分子化学等多个领域。
为什么是“科学计算领域”?因为这个ai大模型名字的来源就是台超级计算机——aurora。
自打2021年,英特尔就宣布为美国阿贡国家实验室打造一台aurora超级计算机。这之后历经多次更改计算平台和工艺架构,所以迟迟不见落地,对其性能也是秘而不宣。
而在近日的德国汉堡举行的高性能计算展上,英特尔终于正式揭露了这台超算的一些参数。
aurora超级计算机采用英特尔xeon(至强)cpu max和xeon gpu max系列芯片的支持,并将计算能力从最初的1 exaflop(100亿亿次)提升至2 exaflop(200亿亿次),使其与基于amd芯片的frontier超级计算机媲美(frontier是目前已公布的地球上最强超级计算机)。
aurora超算有10624个节点,每个节点2组cpu和6组gpu。cpu采用sapphire rapids-sp架构,总共21248个;gpu采用intel的最强ponte vecchio,总共63744个。
aurora genai就是aurora超级计算机的配套模型。aurora genai 模型以 megatron 和 deepspeed 为基础,其规模达到了 1 万亿参数,相比之下 chatgpt 的规模仅为 1750 亿参数,当然还远不及gpt4的百万亿参数。
aurora genai 模型将在通用文本、科学文本、科学数据和与该领域相关的代码上进行训练。按照设想,它的潜在应用范围大概是:
推动清洁能源聚变研究
催化剂研究
癌症研究
航空航天研究
神经科学研究
宇宙学研究等
押宝ai芯片,对决英伟达
据英特尔自己介绍,由于英特尔数据中心gpu max系列处理器的加持,实现了超过英伟达(nvidia)a100和amd instinct mi250x加速器的最快simplefomp性能。英特尔也强调这款系统的表现会优于使用英伟达h100芯片的hpc。
众所周知,现在各个大模型训练算力几乎全部来自英伟达的a100和h100gpu。
所以从公布的信息中,能发觉英特尔不是单纯地在说这台超算的能力,而是矛头直指gpu霸主英伟达。
当然理想是美好的。和英伟达比起来,英特尔在ai芯片业务的市场份额几乎为零。
2021年英特尔宣布aurora超算时,对在上面应用的“ponte vecchio”旗舰数据中心gpu寄予厚望。但之后项目不断跳票,让英特尔失去了先机。
现在英特尔将希望押注在全新的“falcon shores gpu”身上,它是在aurora超算上使用的“ponte vecchio”的 max 系列 gpu 继任者。
这也代表了英特尔关于如何构建下一代超级计算芯片的思维转变。他们决定暂时搁置将 cpu 和 gpu 集成到 xpu的战略计划,专心搞好falcon shores,应对接下来的挑战。
英特尔既有远虑,又有近忧。
根据英特尔的计划,falcon shores gpu最快也要2025年投产。而另外一个宿敌amd将在今年晚些时候推出他们的instinct mi300芯片,这被amd视作挑战英伟达h100的杀手锏,并将为劳伦斯利弗莫尔国家实验室的 2 exaflops(峰值)超级计算机 el capitan 提供动力。
此外,微软、谷歌、亚马逊也都开始下场研发ai芯片。粗略统计,这三家已经推出或计划发布8款服务器和ai芯片。虽然英特尔贵为芯片龙头,但在ai领域毕竟涉猎未深。面对这几位巨头的持续发力,英特尔真的压力山大。
而在几年之后falcon shores成功出世之时,真正的强敌英伟达又会拿出怎样的“核弹”来结束这场对决,还是未知数。
来源:中自网
以上是网络信息转载,信息真实性自行斟酌。











)







