Share - WeChat
3月10日
去年已实现量产近千台的
中国机器人初创公司智元机器人发布
通用具身基座模型智元启元大模型
(Genie Operator-1,简称GO-1)
因其首创的ViLLA架构
降低了具身智能研发门槛
并能够让机器人持续进化
让不少网友评论称:
“这破解了具身智能的‘进化密码’”
机器人“烤面包”。
图源:智元机器人官网
网上的视频
也能用于训练机器人了
据了解,GO-1创新性采用了
Vision-Language-Latent-Action (ViLLA) 架构
由VLM(多模态大模型)
和MoE(混合专家)组成
可谓让人形机器人拥有了智慧大脑
智元机器人相关负责人介绍
GO-1大模型的特点包括4个方面
机器人“煮咖啡”。
图源:观察者网
一是可以利用人类视频学习各种技能
增强模型对人类行为的理解
例如,它可以根据之前训练时
看过的“挂衣服”视频
设想这个过程包括哪些步骤
然后执行一连串步骤完成任务
二是能在极少数据甚至零样本下
使机器人快速适应新场景、新任务
完成小样本快速泛化
例如让人形机器人“倒水”
搭载大模型后
完成该动作需采集的数据量
较未搭载大模型减少1/10至1/50
三是能够在不同机器人形态之间迁移
快速适配到不同本体
此外,该大模型还可以
从实际执行遇到的问题数据中
持续进化学习
“越用越聪明”
机器人站上服务台。
图源:观察者网
业界相关人士表示
GO-1大模型将加速具身智能普及
机器人将从依赖特定任务的工具
向着具备通用智能的自主体发展
将具身智能推上了一个新台阶
人形机器人“打工”
还要多久才能实现
让机器人擦桌子、拉小提琴
如今早已不是新鲜事
但这类机器人只能完成预设程序
而非具备自主完成任务的能力
或者说并不真正具备“智能”
随着具身智能的不断演化
机器人正在逐渐完成
“从单一任务到多种任务”
“从封闭环境到开放世界”
“从预设程序到指令泛化”
三层进化
也就是说
随着人工智能技术的不断进步
和软硬件的持续优化
人形机器人的商业化进程正在加速
灵巧机械手与观众互动。
图源:新华社
在美银近日发布的研报中,分析师预测
人形机器人即将告别概念验证阶段
在十年内迎来多行业应用爆发期
预计到2030年
全球人形机器人年销量将达到100万台
到2060年
人形机器人总保有量将达30亿台
届时人均将拥有0.3台机器人
日前国泰君安在研报中也进一步提到
特斯拉的Optimus
计划在2025年步入量产
2026年大规模生产
中国多家人形机器人厂商
也计划开启外售
人形机器人将迎来“量产元年”
智元机器人相关负责人表示
目前,机器人能够
在不同场景中执行多种任务
而不需要针对每个新任务重新训练
也不再局限于预设程序
能够理解自然语言指令
并具备一定推理能力
一旦机器人“能听懂人话”
就可以在商业、工业、家庭等多领域
发挥更大的作用
在北京市机器人产业园(亦庄),国家地方共建具身智能机器人创新中心研发的人形机器人“天工”在进行奔跑展示。
图源:新华社
家庭服务有望成为
具身智能机器人落地应用的重要场景
智元机器人相关负责人说
真正让人形机器人走进家庭“打工”
预计还需5年左右
在位于深圳市南山区智园的优必选总部,工作人员对人形机器人进行测试
图源:新华社
同时,有业界人士还提到
脑机接口技术可以实现
将智能算法与机器人的
感知、行动和环境交互能力相结合
在医疗康养、工业安全
教育体育、智慧生活等领域
展现广阔发展前景和巨大市场潜力
此外,应对人口老龄化、科学研究
以及太空探索等人类社会发展问题
也需要具身智能技术的辅助
2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。