Share - WeChat
近日
谷歌DeepMind
向外部开放了世界模型
Project Genie
这是世界模型Genie 3的
实验性研究原型
被媒体认为是
目前“最先进的世界模型之一”
这也是这套世界模型首次开放
世界模型是什么
报道称
用户在使用
Genie 3时
通过自然语言
输入提示词或上传一张图片
即可生成一个可交互的虚拟空间
可操纵角色自由行动
Genie 3的逻辑
是根据用户的动作
实时生成前方路径
在这个动态虚拟世界里
以每秒24帧的速度渲染环境
分辨率达720P
Genie 3还展现出
对物理规律的初步理解
并具备一致性
……
过去
AI很擅长
在封闭规则里表现出色
比如国际象棋、围棋
但要迈向真正的AGI
就要面对这样一个问题
“现实世界,没有剧本”

世界模型演示动画
而世界模型的本质
就是让AI理解和预测
世界如何运转
它不再是
静态的3D场景
而是一个会随用户行动
实时生成的世界
从机器人训练、动画制作、小说创作
到探索真实地点或历史场景
都会变得更加方便
有媒体表示
世界模型并非一个
内容端的创作工具
而是一座连接当前AI
与未来“具身智能”的桥梁
是让AI学会“常识”与“因果”的
关键基础设施
科技公司争相布局
业内有观点认为
世界模型对打造
下一代人工智能至关重要
该技术未来将助力创造
超越人类的AGI
以斯坦福大学教授李飞飞
创立的世界模型
初创公司World Labs来举例
该公司最新估值
有望达到约50亿美元
与此同时
Meta的超级智能AI实验室
与机器人团队合作
正是为了构建世界模型
通过模拟现实世界物理规律
为机器人提供空间感知
和精细操作能力
弥补现有机器人的不足
蚂蚁集团也发布了
世界模型LingBot-World
具身世界模型LingBot-VA等
……
值得一提的是
xAI、英伟达等公司
也希望将世界模型
嵌入机器人和自动驾驶汽车中
或将最先落地游戏行业
谷歌DeepMind、World Labs等
AI团队都认为
世界模型
可能会首先
重塑游戏、影视行业
有报道称
传统游戏中的
3D资产创建与场景搭建等
人力与时间密集型的核心环节
Genie 3这类世界模型
有望将游戏中部分前期概念设计
场景原型构建乃至
动态分镜预览的过程
压缩至几分钟甚至几秒钟
业内人士表示
目前来看
游戏开发者可以
借助世界模型完成游戏Demo
却仍需使用游戏引擎完善产品
玩家要的
是更好的游戏体验
而不是技术本身
2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。