Share - WeChat
据法新社报道
北京时间2月18日中午
埃隆·马斯克(Elon Musk)
在X平台直播发布
旗下xAI公司研发的Grok 3模型
并进行现场演示
在此前举行的世界政府峰会上
马斯克通过视频通话表示
Grok 3是“地球上最聪明的人工智能”
xAI在X平台直播,马斯克到场
图源:X平台
Grok 3有哪些新功能
“我们非常高兴能够推出Grok 3
我们认为
在很短的时间内
它的功能比Grok 2强大一个数量级”
马斯克在发布会上说道
如何判断Grok 3是否“聪明”?
xAI团队
在直播中直接展示了相关数据
并称Grok-3和Grok-3 mini
在多方面的测试得分上
都超过或媲美Gemini和ChatGPT等
Chatbot Arena成绩
图源:xAI
Grok 3的数学、科学和编程基准测试成绩
图源:xAI
直播还提到
具备推理能力的
Grok-3 Reasoning Beta
和Grok-3 mini Reasoning
超越了类似的推理模型
包括DeepSeek-R1
和OpenAI的o3 mini等
Grok 3生成的代码可以直接运行
图源:xAI
为现场演示Grok 3的推理+编程能力
团队还演示用Grok 3生成代码
并运行了这段python代码
画面上显示出了
飞船在地球和火星间往返的3D动画
但是否正确还有待验证
随后
Gork 3又演示了制作一款
类似于俄罗斯方块的游戏
马斯克称
将在xAI推出一个人工智能游戏工作室
DeepSearch功能演示
图源:xAI
除此之外
Grok 3的最后一个新功能
是代理/智能体(Agent)
发布会上演示了
基于Grok 3的搜索引擎
新产品DeepSearch
xAI团队称它不仅可以搜索网页
查找现有资料
还可以“推测用户的真正意图”
并加以思考
在经过交叉对比不同信源后
确保“能够返回正确的信息”
用了合成数据和10万张GPU
相关报道称
xAI通过修改Grok 3的训练流程
实现了更好的性能
更新后的模型实现了
合成数据集、自我纠正和强化学习
Grok 3最大的亮点
在于其引入了“思维链”
(Chain Of Thought)推理机制
这一机制允许Grok 3像人类一样
分步骤解决复杂问题
显著提高了模型处理复杂查询
和提供更连贯、更有逻辑响应的能力
马斯克在发布会上表示
这种推理机制使得Grok 3
在逻辑推理测试中的表现
远超GPT-5和谷歌的Gemini Ultra
能够构思出新颖的想法和解决方案
Colossus设施
图源:xAI
xAI团队在直播中还介绍
Grok 3由Colossus超级计算机训练完成
这台计算机是在短短八个月内建成的
搭载了10万张英伟达H100 GPU
提供了超过2亿GPU小时的计算资源
——这个数据是Grok 2的10倍
在训练Grok的过程中
团队除了搭建了大型算力集群
还克服了散热、电力等问题带来的挑战
用了122天让首批10万张GPU
投入使用并正常运行
现在他们计划将集群规模
继续扩大一倍
关于后续体验使用
xAI团队在直播中表示
“我们今天将推出Grok 3
首先从X上的Premium+订阅者开始
他们将是第一批获得访问权限的人”
尚不清楚普通用户何时能用上
马斯克补充称
“如果你想要一个更完善的版本
可能要等待一周
但每天都会有所改进
我们还在开发语音交互功能
我认为这将是Grok 3最好的体验之一”
参考:新华财经、央视财经、中国新闻网、环球网、中国证券报、界面新闻、第一财经、财联社、DeepTech深科技
2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。