生成式人工智能还可能导致信息“过载”,其快速生成并传播大量内容的能力可能导致读者被信息淹没,不得不耗费更多时间和精力来甄别和验证信息
当下新闻机构的一个困境是,科技企业推出的AI工具根据从网上抓取的新闻进行整合并提供AIGC,使用户已无需通过访问媒体网站和App等来阅读文章,这导致新闻机构损失了流量和广告收入
文 |《瞭望》新闻周刊记者 杨士龙 张建伟
随着微软公司支持的美国开放人工智能研究中心(OpenAI)聊天机器人ChatGPT横空出世,在人工智能(AI)应用方面起步较早的美联社、《纽约时报》等新闻机构纷纷加紧推出以“数据+生成式人工智能”为驱动力的业务流程和解决方案,试图保持并加强其在全新媒体业态下的竞争力。
在此过程中,如何坚守新闻伦理、保持公信力,如何保护产品版权、创新运营模式,如何避免对AI科技巨头过度依赖、推动相关立法和行业规范等,也成为美国新闻行业亟需破解的难题。
新闻“翻车”
今年4月,总部位于旧金山市的社区新闻网站Hoodline被曝以虚假署名发布人工智能生成内容(AIGC)新闻报道,受到媒体和业内专家广泛批评。这再次放大了人们对新闻机构如何在全新媒体业态下坚守职业伦理、保持社会公信力的深度担忧。
Hoodline是一家成立于2014年的网络媒体,从报道旧金山本地新闻逐步扩展为覆盖全美主要城市新闻事件报道,每月吸引着数百万读者。
虽然该网站正式的免责声明声称其“新闻的核心”由“真实的人类洞察和判断驱动”,该网站也曾雇用真人新闻团队,但其去年起发布的不少AIGC文章署名是虚构的,甚至配发了AI生成的人物头像和简介,给读者造成了文章由真人执笔的错觉。
目前这些虚假头像和简介已移除,取而代之的是文章署名旁的小“AI”标签,但虚构的作者姓名仍然存在。Hoodline网站上充斥着大量由软件撰写的文章,大部分内容似乎是直接从已发布的新闻稿和社交媒体帖子聚合而来的。
美国全国性非营利教育机构“新闻素养项目”高级副总裁彼得·亚当斯说,Hoodline网站利用和披露AI技术的方式“公然不透明”,故意“模仿本地新闻机构和真实记者”来欺骗读者。
Hoodline前记者努娅拉·比沙里在为《旧金山纪事报》撰写的专栏文章中说,看到昔日的工作已然被AI所取代,她“感觉非常不真实”,“根本没有脚”的AI虚拟人物从未踏足过他们采写的任何社区,其报道却取代了“老派实地报道”。
Hoodline不是第一家因使用AIGC报道而“翻车”的美国媒体。2022年,美国科技媒体CNET一度使用AI生成部分文章,但因文章中存在大量语法错误且存在严重抄袭行为,其声誉大幅受损,CNET随后叫停了AI项目。《体育画报》和甘尼特报业连锁集团旗下媒体也曾出现过类似事件。
专家指出,新闻机构面临保持AIGC真实性和公信力的重大挑战。人工智能可能会复制或放大现有数据中的错误,生成虚假信息和宣传。训练AI模型所用的数据可能带有偏见,导致AI生成的内容存在偏颇,影响新闻的公正性。虽然个性化新闻推荐提高了用户体验,但算法偏见也可能导致“信息茧房”现象,导致读者只接触到与其观点一致的信息,从而加大公众意见分歧。
同时,过度依赖AI技术可能导致新闻失去独立性和创造力,削弱新闻的多样性和深度。生成式人工智能还可能导致信息“过载”,其快速生成并传播大量内容的能力可能导致读者被信息淹没,不得不耗费更多时间和精力来甄别和验证信息。
明尼苏达大学新闻与大众传媒学院助理教授本杰明·托夫指出,新闻机构“急于接受创新可以理解”,但眼下美国民众对媒体的信任十分脆弱。他认为,新闻机构应了解受众对AI技术的看法,“以及他们对记者在使用这些工具时的透明度和披露程度的期望”。
参观者在美国拉斯维加斯消费电子展上体验VR设备(2024年1月11日摄) 吴晓凌摄/本刊
起诉还是授权
对新闻行业而言,AIGC的版权归属是一个复杂的问题。传统版权通常归属于创作者或创作者雇主,但AIGC版权可能归属于训练数据的提供者、算法开发者、系统操作者甚至最终用户。对此,美国国内目前还没有明确的法律规定。
当下新闻机构的一个困境是,科技企业推出的AI工具根据从网上抓取的新闻进行整合并提供AIGC,使用户已无需通过访问媒体网站和App等来阅读文章,这导致新闻机构损失了流量和广告收入。
目前,美国新闻机构走出了三条维权路径。
一是起诉索赔。
去年12月,《纽约时报》在纽约一家法院对OpenAI和微软提起诉讼,打响了向AI科技公司维权的第一枪。《纽约时报》指控OpenAI和微软未经许可使用该报数百万篇文章来训练其生成式人工智能工具,要求它们承担数十亿美元的赔偿并销毁相关数据。
今年3月,美国“截击”网站等三家数字新闻媒体分别提起诉讼,指控ChatGPT在删除作者姓名等新闻要素的同时,“逐字或几乎逐字”复制新闻内容。
5月初,美国对冲基金公司“奥尔登全球资本”旗下《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》等八家报纸也加入起诉OpenAI和微软的行列,指控其非法复制数百万篇文章来培训AI模型。
二是合作共赢。
去年7月,美联社成为第一批与OpenAI签署合作协议的新闻机构。合作方式为OpenAI用美联社的文本档案库内容来训练AI,作为回报,美联社可利用OpenAI的技术和知识。
今年5月,《华尔街日报》母公司新闻集团也与OpenAI签订为期五年的内容授权协议。据称协议金额高达2.5亿美元。
其他与OpenAI达成商业合作的新闻机构还包括:美国《人物》杂志出版商多特达什-梅雷迪思公司、拥有《政治报》和《图片报》的德国阿克塞尔·施普林格公司,以及法国《世界报》和西班牙《国家报》的母公司。
业内人士认为,面对AI公司咄咄逼人的挑战,新闻机构选择起诉还是合作,在一定程度上是由其商业模式决定的。然而,即使与AI公司签订了内容许可协议,摆在新闻机构面前的难题也是显而易见的:虽然可以马上获得现金收益和相关技术红利,但必然有被剽窃甚至被取代的风险。
三是独善其身。
例如,杰夫·贝索斯掌控的《华盛顿邮报》和拥有《今日美国报》的甘尼特报业连锁集团,既未合作也未起诉,而是选择开发自己的AI工具。
布鲁金斯学会客座研究员、开放市场研究所新闻与自由中心主任考特妮·拉德施认为,美国新闻机构能否在AI时代存活,取决于它能否适应新的商业模式。政策制定者若想纠正市场失衡,必须执行知识产权相关法律,为新闻业保留生存机会。
过去十年间,美国知名新闻网站总流量有所增长,收入却在下降,“因为几家硅谷科技巨头在数字广告、出版、受众、数据、云计算和搜索领域的主导地位破坏了全球新闻业的商业模式”,而这一幕正因AI技术崛起而重演。
拉德施指出,新闻机构应力争在整个AI价值链中享有更大的定价自主权,为其提供的新闻内容和从AI公司获取的补偿设置更合理、可动态调整的价格,并努力释放通过新闻内容换取的AI系统和应用的价值。作为定价策略的一部分,新闻机构需要获知AI公司如何使用其新闻内容,还需获得政府监管的支持。
西方媒体的应对方案
4月15日至17日在纽约召开的国际报业电信理事会(IPTC)2024春季研讨会,重点探讨了新闻行业在生成式人工智能技术大发展的环境下面临的挑战与机遇。
记者参会期间最主要的体会是,西方新闻机构正在充分利用AI技术优势,同时探索规避潜在风险,以实现可持续发展。
一是AI系统平台化。
今年,由欧盟委员会资助的欧洲数字战略计划推出了“可信欧洲媒体数据空间”项目(TEMS),旨在为媒体行业建立一个数据空间,以“数据+AI”为驱动力,增强新闻机构的可信性和互操作性,提升其创新和营收能力。
来自11个国家的约40个组织组成了联合项目组,共同参与设计开发数据空间的基础模块,定义并创新治理和商业模式,通过大规模部署尖端服务、基础设施和平台,重新定义媒体间数据共享和从数据中提取价值的方式。目前,TEMS设有八个项目,包括专注于内容共享、事实核查、个性化分析服务的内容共享平台,专注于个性化广告、营收变现的商业平台,以及专注于创新型视听体验的虚拟现实产品平台等。
2023年,奥地利通讯社(APA)集团也推出了“可信人工智能平台”。可信平台是可信内容的进一步发展,也是APA集团透明、负责任的人工智能战略的重要一步。作为全方位人工智能服务提供商,APA集团努力让人工智能在奥地利媒体市场的各个层面都可应用,并从AI模型的创建、对AI模型的修改和微调、AI应用系统化、根据用户需求创建独立的AI应用等四个层面定义了可信人工智能平台。
APA集团正从一家多媒体内容供应商向基于数据和人工智能的生产平台转型。未来,APA集团将逐步发展出一套与媒体制作系统紧密相连的协作平台,该平台可与可信人工智能解决方案进行无缝对接,最终发展成奥地利人工智能媒体中心,作为奥地利媒体公司共同的知识空间,满足人们在基于事实信息基础上的AI使用需求。
二是行业自律和规则正逐步建立和完善。
2022年6月,欧洲地区主要在线平台、广告行业参与者、事实核查机构、研究机构和民间社会组织等34个组织共同签署并发布了《反虚假信息行为守则》,旨在通过制定更全面的措施打击在线虚假信息。
IPTC在研讨会上建议标记生成式人工智能内容,特别是在照片中使用该理事会的元数据新闻标准进行标注,还建议数据使用者遵从数字资产版权人的使用要求,在使用数字资产的过程中永久保留元数据信息。
三是探索版权保护新技术。
谷歌公司和法新社的合作伙伴IMATAG公司都对如何保护数字资产的版权提出了相应的解决方案。
谷歌采取的措施包括:在图片中加入水印技术,用于鉴别AI合成的内容。推出SynthID,用户可以使用此工具将数字水印直接嵌入他们创建的人工智能生成的图像或音频中。使用元数据技术,允许作者将创作内容相关的信息关联到原始数据中,让使用者可以了解更多的背景信息。在自有AI生成内容中自动加入相关元数据信息。
IMATAG公司也是不可见水印技术的倡导者。该公司认为,利用这一技术,不仅可以保护数字版权,还可以追踪数字资产在互联网上的流通情况。