Share - WeChat
近日
谷歌云(Google Cloud)宣布
正式向客户开放第六代TPU
(Tensor Processing Unit,张量处理器)
Trillium芯片
谷歌云称
Trillium标志着AI超级计算机架构的
重大突破
第六代TPU是什么
在全球科技产业
将目光紧紧锁定人工智能领域之际
TPU正在悄悄成长为
AI时代的“弄潮儿”
TPU由谷歌率先推出
最初
TPU是谷歌专为加速机器学习、
深度学习任务而设计的专用芯片
自2022年底生成式人工智能
获得产业界广泛关注以来
TPU在生成式人工智能领域的应用范围
逐步拓宽
11月19日,在2024年世界互联网大会“互联网之光”博览会上,一台人形机器人(右一)与参观者互动。
图源:新华社
谷歌官方博客介绍
Trillium TPU
是Google Cloud
AI超级计算机的关键组件
与上一代相比
Trillium TPU在训练性能上
提升4倍以上
推理吞吐量提升3倍
峰值计算性能提升4.7倍
能源效率提高67%
简言之
这一代突破性的技术进步
不仅提升了性能还大幅降低了能耗
谷歌CEO桑达尔·皮查伊透露
谷歌性能最强的AI模型Gemini 2.0
也是基于Trillium TPU进行的训练
AI专用芯片TPU成性价比之选
随着
大模型训练的
计算量和复杂度的
指数级增长
传统GPU成本昂贵
算力利用率低
能耗大的局限日益凸显
马斯克曾表示
2024年
特斯拉仅仅在英伟达的人工智能芯片上
就将耗费超过5亿美元
高昂的算力成本
使一众全球顶尖的科技企业望而生畏
在此背景下
作为AI专用芯片之一的TPU
被业界期待
能够从新的技术路线上另辟蹊径
今年2月
美国AI芯片初创公司Groq
凭借其开发的新型AI处理器LPU引发关注
其使用的TSP(张量流处理器)源头
就是谷歌研发的TPU
今年4月
英特尔推出了
专攻深度学习神经网络推理的
类TPU芯片Gaudi 3
7月30日
苹果公司发布的一篇研究论文称
苹果在训练Apple Intelligence生态中的
人工智能模型AFM时
选择了谷歌的两种TPU云集群
算力产业加速前进
AI模型规模的扩展和应用落地
全球算力需求呈现爆发式增长
叠加政策利好接踵而至
推动算力行业高速发展
企业和政府纷纷加大投入
积极在AI算力和AI芯片等方面积极布局
工作人员在贵州大学省部共建公共大数据国家重点实验室算力中心检查设备运行情况。
图源:新华社
亚马逊和微软这两家超大规模公司
都在开发内部AI芯片
如亚马逊的Trainium和微软的Athena
在2024年世界互联网大会
领先科技奖颁奖典礼上
也有不少成果和算力息息相关
由中国国家高性能计算机工程技术研究中心
发布的“超算互联网平台”项目
连接各地算力中心
实现算力资源的统筹调度
腾讯公司发布的
“Angel大规模机器学习平台
关键技术与应用”
实现了单任务万卡的线性扩展
……
据中国信息通信研究院测算
预计未来5年
全球算力规模
将以超过50%的速度增长
业内人士表示
伴随以人工智能为代表的
数字技术持续创新
算力产业将步入高速发展的快车道
撰文:曾震宇 王恺 编辑:李飞 排版:李汶键 统筹:李政葳
参考:中国电子报、上海证券报、光明网、谷歌云官方博客
2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。