12月3日消息,亚马逊AWS宣布其新一代自研AI芯片Trainium3已正式推出市场。
作为亚马逊首款运用3nm制程工艺的芯片,Trainium3在计算性能、能效表现以及内存带宽方面都取得了显著的提升。
相较于上一代产品,Trainium3的计算性能最高提升了4.4倍,能效提升4倍,内存带宽也几乎翻了两番。依托Trainium3打造的UltraServer系统具备互联扩展能力,单个系统能够容纳144枚芯片,还能为单一应用提供多达100万枚Trainium3芯片的算力支撑,其规模达到了上一代的10倍。
亚马逊指出,相较于配备图形处理单元(GPU)的系统,运用Trainium3来训练并运行AI模型,能够将成本最多降低50%。
另外,亚马逊也已启动下一代产品Trainium4的研发工作。根据相关披露信息,Trainium4有望实现FP4计算性能提升6倍、FP8性能提升3倍,内存带宽和容量则将分别提升至原先的4倍与2倍,同时还支持借助NVLink Fusion和UALink技术来达成纵向扩展。
关于与行业领军企业英伟达的关系,AWS负责Trainium项目的副总裁兼首席架构师Ron Diamant清晰地指出:“我认为我们不会尝试去替代英伟达。”