Share - WeChat
12月1日
DeepSeek(深度求索)
发布两个正式版模型
DeepSeek-V3.2
DeepSeek-V3.2-Speciale
DeepSeek介绍
新模型
推理能力全球领先
并且支持
思考模式下工具调用等特征

两大模型各有千秋
推理能力全球领先
从官方公开的信息来看
在推理能力方面
DeepSeek-V3.2的目标是
平衡推理能力与输出长度
适合问答和通用Agent任务等
日常使用场景
在公开推理类基准测试中
DeepSeek-V3.2达到
OpenAI模型GPT-5的水平
仅略低于谷歌的Gemini-3.0-Pro模型
在Agent评测中
DeepSeek介绍
该模型
“达到当前开源模型最高水平”
且未针对测试工具进行特殊训练
DeepSeek-V3.2-Speciale的目标是
将开源模型的推理能力
推向极致
探索模型能力边界
在主流推理基准测试中
该模型性能表现
媲美Gemini-3.0-Pro
在国际大学生程序设计竞赛全球总决赛
和国际信息学奥林匹克竞赛中
成绩分别达到
人类选手第二名、第十名水平

DeepSeek-V3.2模型推理能力对比
图源:DeepSeek
在调用工具方面
DeepSeek模型过往版本
在思考模式下无法调用工具
V3.2将思考融入工具使用
并同时支持思考模式
与非思考模式的工具调用
有媒体评价称
两大模型各有千秋
DeepSeek-V3.2
定位“平衡实用”
可以当做“日常利器”
DeepSeek-V3.2-Speciale
则为“极致推理”而生
可以看作“科研尖兵”
开源提供全球新标杆
两款模型
已在HuggingFace等平台开源
用户可通过官方渠道
直接体验DeepSeek-V3.2
研究者可申请使用
DeepSeek-V3.2-Speciale临时API
有媒体评价
此次双模型发布
不仅展示了
DeepSeek在高效架构
强化学习与Agent能力的进展
更规划了开源模型
实用化与探索极限的双路径
为全球开源社区提供新标杆
2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。