谷歌母公司Alphabet于11月6日宣布,其第七代自研人工智能推理芯片TPU Ironwood将在未来数周内全面开放给企业与开发者使用。这款芯片最早在今年4月亮相,经过测试后,现已进入逐步部署阶段。谷歌表示,Ironwood专为处理AI推理任务而设计,能够支持大型语言模型的推理、复杂的生成式AI以及高吞吐量的实时推理等任务。
根据谷歌云AI与基础设施负责人Amin Vahdat和计算平台负责人Mark Lohmeyer的介绍,Ironwood的峰值性能较前代TPU v5p提升了10倍,而在推理场景中,其单芯片性能效率较TPU v6e(Trillium)提升超过4倍,成为谷歌迄今为止“最强大、最节能的定制芯片”。此外,Ironwood支持最多9,216颗芯片互联组成超级算力集群(superpod),显著提升数据吞吐量与推理速度,帮助企业突破大模型推理时的带宽与延迟瓶颈。
在实际应用方面,AI大模型公司Anthropic计划使用多达100万颗Ironwood TPU来支撑其下一代模型的推理需求。Anthropic目前同时获得谷歌与亚马逊的投资,被视为谷歌芯片战略落地效果的重要合作伙伴。
与此同时,谷歌还宣布扩展自研Arm架构CPU产品线Axion,并推出多款面向云计算市场的新实例。其中,N4A虚拟机已进入预览阶段,谷歌称其价格性能比同类x86虚拟机提升两倍;另一款C4A裸金属服务器也将很快进入预览,主要用于Android开发、车载系统、严格授权软件、高密度测试及复杂模拟等专业场景。
资讯分类:
相关文章
相关报告