Share - WeChat
参考消息网2月25日报道 《日本经济新闻》2月24日发表报道,题为《深度求索“知识蒸馏”技术加速推进,美国人工智能开源风渐盛》,内容编译如下:
美国的人工智能(AI)企业正在形成“开放源代码”的热潮,以便外部技术人员使用生成式人工智能的基础模型。这是对美国开放人工智能研究中心(OpenAI)消极对待技术公开的一种反抗,同时中国深度求索公司(DeepSeek)使用的“知识蒸馏”技术有望助力降低模型成本。
反对OpenAI等技术垄断的开源势力正在增大。有观点认为,来自中国的深度求索将加速这一进程。深度求索将把响应速度快的“V3”和数学等逻辑推理能力强的“R1”等模型对外部进行了开源。
美国主张开源的企业得到了启发,提高性能的关键是“知识蒸馏”。“知识蒸馏”指像老师教学生学习一样,利用既有模型(老师角色)的输出数据建立新模型(学生角色)的人工智能开发手法。因为学习了老师的优点,所以比起从零开始开发模型,能够做到效率更高,成本更低,性能更高。
“‘知识蒸馏’已被证明是制造廉价推理模型的有效方法。所有模型最终都将开源。”人工智能领域著名的独角兽(企业价值超过10亿美元的未上市企业)、美国Databricks首席执行官阿里·戈德西这样预测深度求索之后的开发趋势。
OpenAI在使用条款中禁止“知识蒸馏”。但戈德西说:“封闭的模型也不能完全阻止‘知识蒸馏’。因此,与其被批评为封闭,不如采用开源方式。”
企业家埃隆·马斯克麾下的美国xAI公司17日发布了新模型“格罗克3”,同时表示将在几个月内对老款模型“格罗克2”进行开源。虽然不能说xAI会全面进行开源,但马斯克表示:“在提供新模型的完整版时,我们会公开之前的模型。”马斯克强烈批评OpenAI不再公开技术这一点。
OpenAI的态度也发生了变化。1月底,当被问及对开源的看法时,公司首席执行官萨姆·奥尔特曼首先表示这不是一个优先课题,接着指出:“我个人认为我们站在了历史错误的一边。有必要考虑新的开源战略。”
开源开发的进展推动了模型价格的降低。美国风险投资公司的安德森·霍洛维茨表示,截至2024年的3年内,利用与OpenAI“GPT-3”相当的模型来处理一定信息量的最低费用已降至原先的千分之一。该公司的马克·安德森将其称为“趋向底部的竞争”。带动价格下降的是美国元宇宙平台公司的“Llama”等开源的模型。
今后,OpenAI和xAI还将投入大量半导体和算力,打造堪称“超级车”的高性能模型。另一方面,通过开源开发和“知识蒸馏”,低成本的“大众车”也会变得更好用。预计将根据不同场合分别使用不同模型。如果与“大众车”的性能差距缩小,用户对“超级车”的付费将发生变化。(编译/刘洁秋)
2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。