日媒：“知识蒸馏”成本低性能高深度求索推动美国AI开源热潮

2025-02-26来源：参考消息网

Share - WeChat

　　参考消息网2月25日报道《日本经济新闻》2月24日发表报道，题为《深度求索“知识蒸馏”技术加速推进，美国人工智能开源风渐盛》，内容编译如下：

　　美国的人工智能（AI）企业正在形成“开放源代码”的热潮，以便外部技术人员使用生成式人工智能的基础模型。这是对美国开放人工智能研究中心（OpenAI）消极对待技术公开的一种反抗，同时中国深度求索公司（DeepSeek）使用的“知识蒸馏”技术有望助力降低模型成本。

　　反对OpenAI等技术垄断的开源势力正在增大。有观点认为，来自中国的深度求索将加速这一进程。深度求索将把响应速度快的“V3”和数学等逻辑推理能力强的“R1”等模型对外部进行了开源。

　　美国主张开源的企业得到了启发，提高性能的关键是“知识蒸馏”。“知识蒸馏”指像老师教学生学习一样，利用既有模型（老师角色）的输出数据建立新模型（学生角色）的人工智能开发手法。因为学习了老师的优点，所以比起从零开始开发模型，能够做到效率更高，成本更低，性能更高。

　　“‘知识蒸馏’已被证明是制造廉价推理模型的有效方法。所有模型最终都将开源。”人工智能领域著名的独角兽（企业价值超过10亿美元的未上市企业）、美国Databricks首席执行官阿里·戈德西这样预测深度求索之后的开发趋势。

　　OpenAI在使用条款中禁止“知识蒸馏”。但戈德西说：“封闭的模型也不能完全阻止‘知识蒸馏’。因此，与其被批评为封闭，不如采用开源方式。”

　　企业家埃隆·马斯克麾下的美国xAI公司17日发布了新模型“格罗克3”，同时表示将在几个月内对老款模型“格罗克2”进行开源。虽然不能说xAI会全面进行开源，但马斯克表示：“在提供新模型的完整版时，我们会公开之前的模型。”马斯克强烈批评OpenAI不再公开技术这一点。

　　OpenAI的态度也发生了变化。1月底，当被问及对开源的看法时，公司首席执行官萨姆·奥尔特曼首先表示这不是一个优先课题，接着指出：“我个人认为我们站在了历史错误的一边。有必要考虑新的开源战略。”

　　开源开发的进展推动了模型价格的降低。美国风险投资公司的安德森·霍洛维茨表示，截至2024年的3年内，利用与OpenAI“GPT-3”相当的模型来处理一定信息量的最低费用已降至原先的千分之一。该公司的马克·安德森将其称为“趋向底部的竞争”。带动价格下降的是美国元宇宙平台公司的“Llama”等开源的模型。

　　今后，OpenAI和xAI还将投入大量半导体和算力，打造堪称“超级车”的高性能模型。另一方面，通过开源开发和“知识蒸馏”，低成本的“大众车”也会变得更好用。预计将根据不同场合分别使用不同模型。如果与“大众车”的性能差距缩小，用户对“超级车”的付费将发生变化。（编译/刘洁秋）

2022年7月12日，世界互联网大会国际组织正式成立，从互联网领域的国际盛会发展为国际组织，总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台，推动国际社会顺应信息时代数字化、网络化、智能化趋势，共迎安全挑战，共谋发展福祉，携手构建网络空间命运共同体。

日媒：“知识蒸馏”成本低性能高 深度求索推动美国AI开源热潮

日媒：“知识蒸馏”成本低性能高深度求索推动美国AI开源热潮