首页 >  新闻中心 > 行业新闻

Share - WeChat

近日

谷歌DeepMind

向外部开放了世界模型

Project Genie

这是世界模型Genie 3的

实验性研究原型

被媒体认为是

目前“最先进的世界模型之一”

这也是这套世界模型首次开放

 

世界模型是什么

 

报道称

用户在使用

Genie 3时

通过自然语言

输入提示词或上传一张图片

即可生成一个可交互的虚拟空间

可操纵角色自由行动

 

Genie 3的逻辑

是根据用户的动作

实时生成前方路径

在这个动态虚拟世界里

以每秒24帧的速度渲染环境

分辨率达720P

Genie 3还展现出

对物理规律的初步理解

并具备一致性

……

 

过去

AI很擅长

在封闭规则里表现出色

比如国际象棋、围棋

但要迈向真正的AGI

就要面对这样一个问题

“现实世界,没有剧本”

 

谷歌首次开放世界模型,有何不同

世界模型演示动画

 

而世界模型的本质

就是让AI理解和预测

世界如何运转

它不再是

静态的3D场景

而是一个会随用户行动

实时生成的世界

 

从机器人训练、动画制作、小说创作

到探索真实地点或历史场景

都会变得更加方便

 

有媒体表示

世界模型并非一个

内容端的创作工具

而是一座连接当前AI

与未来“具身智能”的桥梁

是让AI学会“常识”与“因果”的

关键基础设施

 

科技公司争相布局

 

业内有观点认为

世界模型对打造

下一代人工智能至关重要

该技术未来将助力创造

超越人类的AGI

 

以斯坦福大学教授李飞飞

创立的世界模型

初创公司World Labs来举例

该公司最新估值

有望达到约50亿美元

 

与此同时

Meta的超级智能AI实验室

与机器人团队合作

正是为了构建世界模型

通过模拟现实世界物理规律

为机器人提供空间感知

和精细操作能力

弥补现有机器人的不足

 

蚂蚁集团也发布了

世界模型LingBot-World

具身世界模型LingBot-VA等

……

 

值得一提的是

xAI、英伟达等公司

也希望将世界模型

嵌入机器人和自动驾驶汽车中

 

或将最先落地游戏行业

 

谷歌DeepMind、World Labs等

AI团队都认为

世界模型

可能会首先

重塑游戏、影视行业

 

有报道称

传统游戏中的

3D资产创建与场景搭建等

人力与时间密集型的核心环节

 

Genie 3这类世界模型

有望将游戏中部分前期概念设计

场景原型构建乃至

动态分镜预览的过程

压缩至几分钟甚至几秒钟

 

业内人士表示

目前来看

游戏开发者可以

借助世界模型完成游戏Demo

却仍需使用游戏引擎完善产品

玩家要的

是更好的游戏体验

而不是技术本身

 

 

 

2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。