产业观察 | AI大模型不只是巨头的“狂欢”

2023-04-17
来源:中国电子报
分享

  最近一个多月,AI大模型频繁登上热搜,OpenAI、Google、微软、英伟达、百度、华为、阿里巴巴等纷纷入局,在科技界卷起惊涛骇浪。有观点认为,由于大模型训练极为复杂,耗时耗力且成本巨大,是一场独属于巨头的“狂欢”。然而也有观点认为,面向智能化时代,其实所有公司都站在同一条起跑线上。

  随着“大模型”概念走入我们的视野,如何训练这些大模型,让它们变得更好用、更聪明成为一个亟待解决的工程问题。最初的视觉模型只有几百兆的参数量,而现在的语言模型中,动则百亿、千亿的参数量,甚至万亿的大模型也是见怪不怪。

  模型越大,它对数据筛选、逻辑复杂度、算法匹配、硬件要求和模型优化等方面的要求就会越高,训练难度和训练成本也会相应的随之水涨船高。因此,不少专家认为,从资金规模以及算力、算法应用等多个角度来看,似乎都决定了只有巨头能做好大模型。

  然而,阿里云认为,智能化时代,所有公司其实都站在同一条起跑线上,互联网公司和非互联网公司之间不存在先进或者落后的区别,即便是传统企业也有弯道超车的机会。

  AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。在这样的大背景下,所有软件、所有产品都值得用大模型重做一遍,未来将看到应用爆发、效率革命,AI将成为各行各业新型生产力。

  用大模型重塑各行各业的产业结构并非易事。与其他大厂不同,阿里云选择用云计算来更好的释放大模型的价值与潜力,以通用AI大模型——“通义千问”为基础底座,根据各个行业不同的需求与特点,为不同的企业量身定制不同的大模型。

  也就是说,企业不需要再从“零”起步去训练出一个“好用”的大模型,也不用再关注模型训练本身的繁琐过程,而是可以直接调用已经训练好的通用大模型的全部能力,再叠加自己积累的行业知识和应用场景,“一键式”生成一个适合自身业务发展的专属大模型。

  像“通义千问”可以为企业打造一个专属的数据空间,在智能化办公场景中,不管Word、PPT、图片或者是企业原有的数据库都可以接入这个数据空间,在通过“通义千问”多模态能力进行深度学习与理解,再通过与行业知识的有机结合,快速解决行业特定问题。

  未来,云计算或将成为AI大规模普及的最佳方式。据阿里云透露,在云上训练一个模型的成本未来将有可能降低到现在的十分之一,甚至是百分之一。即使是中小企业,也能通过云平台获得AI大模型的能力和服务。

  大模型不是简单的拿来就能用了,而是要针对企业相关场景进行定制。定制的过程不需要对大模型本身架构进行重塑,只需要对相关功能进行微调,在通用大模型的基础上,根据行业特质进行二次开发即可。这种创新思路无疑为大模型未来在各行各业的普及与应用打开了更大的想象空间。

  一家企业的想象力终归是有限的,释放AI潜力要靠无数人探索。实际上,大模型并不是一场只有巨头才有能力参与其中的“游戏”,而是一场所有企业、所有机构,甚至所有人都可以加入进来的科技盛宴。