中文 / English

首页 > 新闻中心 > 行业新闻

谷歌新一代AI芯片性能将提升四倍

2024-12-13来源：世界互联网大会

Share - WeChat

近日

谷歌云（Google Cloud）宣布

正式向客户开放第六代TPU

（Tensor Processing Unit，张量处理器）

Trillium芯片

谷歌云称

Trillium标志着AI超级计算机架构的

重大突破

第六代TPU是什么

在全球科技产业

将目光紧紧锁定人工智能领域之际

TPU正在悄悄成长为

AI时代的“弄潮儿”

TPU由谷歌率先推出

最初

TPU是谷歌专为加速机器学习、

深度学习任务而设计的专用芯片

自2022年底生成式人工智能

获得产业界广泛关注以来

TPU在生成式人工智能领域的应用范围

逐步拓宽

11月19日，在2024年世界互联网大会“互联网之光”博览会上，一台人形机器人（右一）与参观者互动。

图源：新华社

谷歌官方博客介绍

Trillium TPU

是Google Cloud

AI超级计算机的关键组件

与上一代相比

Trillium TPU在训练性能上

提升4倍以上

推理吞吐量提升3倍

峰值计算性能提升4.7倍

能源效率提高67%

简言之

这一代突破性的技术进步

不仅提升了性能还大幅降低了能耗

谷歌CEO桑达尔·皮查伊透露

谷歌性能最强的AI模型Gemini 2.0

也是基于Trillium TPU进行的训练

AI专用芯片TPU成性价比之选

随着

大模型训练的

计算量和复杂度的

指数级增长

传统GPU成本昂贵

算力利用率低

能耗大的局限日益凸显

马斯克曾表示

2024年

特斯拉仅仅在英伟达的人工智能芯片上

就将耗费超过5亿美元

高昂的算力成本

使一众全球顶尖的科技企业望而生畏

在此背景下

作为AI专用芯片之一的TPU

被业界期待

能够从新的技术路线上另辟蹊径

今年2月

美国AI芯片初创公司Groq

凭借其开发的新型AI处理器LPU引发关注

其使用的TSP（张量流处理器）源头

就是谷歌研发的TPU

今年4月

英特尔推出了

专攻深度学习神经网络推理的

类TPU芯片Gaudi 3

7月30日

苹果公司发布的一篇研究论文称

苹果在训练Apple Intelligence生态中的

人工智能模型AFM时

选择了谷歌的两种TPU云集群

算力产业加速前进

AI模型规模的扩展和应用落地

全球算力需求呈现爆发式增长

叠加政策利好接踵而至

推动算力行业高速发展

企业和政府纷纷加大投入

积极在AI算力和AI芯片等方面积极布局

工作人员在贵州大学省部共建公共大数据国家重点实验室算力中心检查设备运行情况。

图源：新华社

亚马逊和微软这两家超大规模公司

都在开发内部AI芯片

如亚马逊的Trainium和微软的Athena

在2024年世界互联网大会

领先科技奖颁奖典礼上

也有不少成果和算力息息相关

由中国国家高性能计算机工程技术研究中心

发布的“超算互联网平台”项目

连接各地算力中心

实现算力资源的统筹调度

腾讯公司发布的

“Angel大规模机器学习平台

关键技术与应用”

实现了单任务万卡的线性扩展

……

据中国信息通信研究院测算

预计未来5年

全球算力规模

将以超过50%的速度增长

业内人士表示

伴随以人工智能为代表的

数字技术持续创新

算力产业将步入高速发展的快车道

撰文：曾震宇王恺 编辑：李飞 排版：李汶键 统筹：李政葳

参考：中国电子报、上海证券报、光明网、谷歌云官方博客

2022年7月12日，世界互联网大会国际组织正式成立，从互联网领域的国际盛会发展为国际组织，总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台，推动国际社会顺应信息时代数字化、网络化、智能化趋势，共迎安全挑战，共谋发展福祉，携手构建网络空间命运共同体。