桂馥兰香网

目前在AI领域,最受关注的就是ChatGPT,以及引起巨大震撼的Sora模型,此外基于Stable Diffusion打造的AI生图也是各大厂商目前所重点宣传的。而作为AI背后的算力硬件支持,英伟达的

Intel Gaudi 2 AI训练比英伟达H100快55%:希望夺取更多市场份额

目前在AI领域,训练希望最受关注的比英就是ChatGPT,以及引起巨大震撼的伟达Sora模型,此外基于Stable Diffusion打造的更多AI生图也是各大厂商目前所重点宣传的。而作为AI背后的市场算力硬件支持,英伟达的份额计算卡可以说备受追捧,供不应求,训练希望英伟达也是比英赚的盆满钵满。当然这也让其他计算卡厂商感到十分地眼红,伟达比如行业巨头英特尔。更多这家蓝色巨人推出的市场Gaudi 2加速卡就是为对抗H100计算卡而生,而经过不断地优化,份额目前在Stable Diffusion领域,训练希望Gaudi 2加速卡的比英表现比NV的计算卡更加出色。

Intel-AIEverywhere-Event-5-scaled.jpg

graphic_1.png

目前Stable Diffusion开发商Stability AI发布了一份报告,伟达在报告中Stability AI重点对比了英伟达与英特尔计算卡在AI作图上的效率。以参数为2B的MMDiT模型为例,训练深度设置为24、BFloat16的混合精度,在该模型设置下,Gaudi 2计算卡最高可以达到每秒训练1254张图片,而256容量下则是每秒927张。这个性能要比英伟达现在的H100更加出色,比如说H100-80GB计算卡的训练速度为每秒595张,而A100-80GB则是每秒训练381张,也就是说基于英特尔Gaudi 2的训练速度在相同容量下比H100计算卡提升55%,更是A100性能的2.43倍。

Intel-Gaudi-vs-NVIDIA-H100-A100-AI-Accelerators-GPUs-Stable-Diffusion-LLMs.jpg

graphic_2.png

另外如果说采用32批量单元的设置下,英特尔Gaudi 2训练速度为每秒12654张,而A100-80GB则为3992张,英特尔计算卡是A100-80GB计算卡的3.17倍,还是相当给力的。当然Stable Diffusion作为现在最为流行的模型,各大计算卡厂商都愿意花精力去优化,而且更为重要的是英伟达的AI生态已经做得十分地完善,并且英伟达B100什么水平还不知道。要是英特尔Gaudi 2训练计算卡真这么给力,那现在AI市场也不会被英伟达所垄断了。

访客,请您发表评论:

© 2024. sitemap