欧洲广播联盟(EBU)今日公布一项大规模研究报告显示,人工智能(AI)助理在回答新闻事件相关问题时,错误率将近半数,出错情况包括:把模仿作品和真实新闻搞混、搞错事件发生时间,甚至捏造不存在的事件。
根据《法新社》报道,来自法国、英国、美国等18个国家的22个公共媒体共同评估了4款广泛使用的AI助理,包括:OpenAI 的 ChatGPT、微软的Copilot、谷歌的 Gemini 及 Perplexity,以测试其准确性、讯息来源及区分事实与意见的能力。
在受测的4个AI助理中,Gemini的表现最差,在76%的回答中出现重大问题,是其他助理的2倍,主要原因是它的来源表现不佳。
研究也发现,无论使用何种语言或地区,45%的AI回答至少出现一个严重错误,而每5个答案中就有1个“含有重大的准确性问题”,包括产生幻觉的细节和过时的资讯。
其中,因讯息不足等因素而生成错误或误导性资讯(俗称“AI幻觉”)是OpenAI及微软正在克服的问题。
另外,资料过时也是最常见的问题之一。
例如:当被问及“教宗是谁”时,ChatGPT、Copilot和Gemini给出的回复都是“方济各”,但当时方济各已过世,由良十四世接任。
对此,欧洲广播联盟表示,随着AI助理日益取代传统搜寻引擎成为新闻来源,公众的信任可能也因此受到破坏。
不过,即便AI助理存缺陷,路透研究所6月发布的一项全球报告却显示,15%的25岁以下青年每周从AI助理获取新闻摘要。
为了持续监测AI,欧洲广播联盟及其成员正敦促欧盟和各国监管机构执行现有法律,内容涵盖资讯诚信、数位服务和媒体多元化。
(新闻整理自《星洲日报》)