日媒:亚洲竞相研发本地语版生成式AI

2024-01-30
来源:参考消息
分享

  参考消息网1月28日报道据《日本经济新闻》1月24日报道,亚洲正积极研发的是,用英语以外语言操作较为方便的生成式人工智能(AI)。越南温纳集团开发出可用越南语操作的生成式AI。中国百度公司研发的生成式AI产品的用户超过1亿人。在人们对依赖美国制造的AI心存警惕的背景下,若能制造出可以理解各国文化和想法的生成式AI,将对各地的商务和生活产生影响。

  “你的发音错了。”“在越南,更多的名字是‘英’而非‘轩’。”2023年12月,温纳集团举行线上发布会。生成式AI对人们故意说错的话进行纠正,说出流畅的越南语,引得观众议论纷纷。

  这款令人称奇的生成式AI是ViGPT,由温纳集团旗下的温纳大数据公司开发。其特点是可以用越南语进行应答。可以认为,这是首款由越南制造、可供普通用户使用的生成式AI。

  据彭博信息研究公司预测,全球生成式AI市场规模将由2022年的400亿美元增至2032年的1.3035万亿美元,后者是前者的约32倍。

  在这一巨大市场中,走在前列的是美国信息技术企业。例如,开放人工智能研究中心(OpenAI)、谷歌和亚马逊等有着雄厚的资金实力和丰富的人才资源。多数企业使用的是美国研发的AI,例如聊天生成预训练转换器(ChatGPT)。

  据称,多数生成式AI利用英语资料数据进行事先学习。因此,如果越南的数据较少,则AI对该国文化、历史、法律的理解不充分且未必正确。

  作为ViGPT基础的大型语言模型(LLM)的参数达16亿个,不及美国OpenAI研发的GPT-4参数规模的数百分之一。一般而言,参数越多,AI越“聪明”,但在用越南语评估AI性能的指标VMLU方面,ViGPT高于多数海外产品,得分仅次于ChatGPT。

  温纳集团旗下的维纳迅驰公司的电动汽车也将有效利用AI技术,旨在实现通过用越南语与AI“对话”来操作汽车。金融、保险和物流领域也将引入AI技术。

  在日本,使用日语的生成式AI也已出现。日本电气公司2023年8月推出基于cotomi(一款LLM)的服务。日本电信电话公司也将自2024年3月起推出基于tsuzumi的服务。两者的特征均是,用日语实现高性能。

  全球各地推进研发“本地生成式AI”的背景因素是,从国际竞争力和安全保障的角度考虑,依赖美国存在风险,机密信息等可能通过海外制造的AI外泄。

  在中国,百度、腾讯和阿里巴巴等公司也在推进研发工作。2023年底,百度推出的生成式AI“文心一言”的用户超过1亿人。

  韩国“领航员”公司2023年8月发布韩语生成式AI:HyperCLOVA X。通过将生成式AI安装于搜索引擎和网购平台,让人们更高效地找到所需信息和商品。

  “领航员”公司韩语数据库数据量是ChatGPT的6500倍,根据海量参考数据可以生成更流畅的文件和识别语言。

  新加坡2023年12月出台计划,旨在开发能理解印尼语、马来语和泰语的LLM。AI研发也将对国家竞争力产生重大影响,出于危机感,各国积极采取行动。(编译/马晓云)