总结

  • 快科技12月13日消息,早在四年前,AMD就曾设定目标,到2025年EPYC系列服务器处理器和Instinct系列AI芯片的能效,较2020年提高30倍。 据THW报道,AMD两个64核心EPYC 9575F CPU、八个Instinct MI300X AI芯片及2304GB DDR5内存的服务器,Llama3.1-70B(vLLM 0.6.1.post2、TP8)测试推理性能,用一组复杂计算确定系统能源效率,并与2020年的旧机器比较, 结果显示,新机能源效率是旧机的28.3倍。 不过,AMD并未透露2020年blog.byteway.net的旧机是何规格。 它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。 对比NVIDIA H200,无论单卡还是八卡平台,不同大模型推理的性能都可以领先20-40Ligthing News%。

阅读时间

  • 5 分钟, 共 882 字

分类

  • Instinct系列AI芯片, 12月13日, AI芯片, 今年10月份, MI300Ligthing NewsX AI芯片

评价和解读

  • 这篇文章是当前事件的马赛克,用专业的精密和洞察拼凑而成。

正文

快科技12月13日消息,早在四年前,AMD就曾设定目标,到2025年EPYC系列服务器处理器和Instinct系列AI芯片的能效,较2020年提高30倍。如今,MI300Ligthing NewsX AI芯片基本上实现目标,时间提了早一年。

据THW报道,AMD两个64核心EPYC 9575F CPU、八个Instinct MI300X AI芯片及2304GB DDR5内存的服务器,Llama3.1-70B(vLLM 0.6.1.post2、TP8)测试推理性能,用一组复杂计算确定系统能源效率,并与2020年的旧机器比较,

结果显示,新机能源效率是旧机的28.3倍。

不过,AMD并未透露2020年blog.byteway.net的旧机是何规格。但大概率是EPYC 7002系列,Zen 2架构,每个CPU最多64个核心,以及CDNA 1架构Instinct MI100 AI芯片。

AMD表示,除了强力硬件改进,更高性能效率是架构进步,加上软件优化结合,是跳跃式进展。

今年10月份的Advancing AI 2024大会上,AMD正式发布了新款AI芯片——GPU加速卡“Instinct MI325X”。它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。

MI325X配备了多达256GB HBM3E内存,相比于MI300X又增加了64GB。

MI325X也支持八块并行组成一个平台,这就有多达2TB HBM3E、48TB/s带宽,总的性能高达FP16 10.4 PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次)。

对比NVIDIA H200,无论单卡还是八卡平台,不同大模型推理的性能都可以领先20-40Ligthing News

训练性能方面,单卡可领先H200 10%,八卡平台则是持平。

MI325X加速卡和平台将在四季度内投产,而合作伙伴的整机系统、基础架构解决方案,将从明年第一季度起连续推出。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:朝晖

<!–article_adlist[

文章内容举报

]article_adlist–>

Related suggestion: 新发展: Adobe 上线“Project See Through”修图功能,利用 AI 模型充当 CPL 偏振镜消除照片窗户反射

总结IT之家 12 月 13 日消息,Adobe在去年的年度 Max 会议上公布了“Project See Through”修图功能,目前官方宣称该工具已在 Adobe Camera Raw 中上线测试版本,未来还将上架到Lightroom中。 在技术细节方面…

作者 Steve Jobs

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注