研究：AI不是可靠新闻来源近半新闻答复存严重错误！

欧洲广播联盟（EBU）今日公布一项大规模研究报告显示，人工智能（AI）助理在回答新闻事件相关问题时，错误率将近半数，出错情况包括：把模仿作品和真实新闻搞混、搞错事件发生时间，甚至捏造不存在的事件。

根据《法新社》报道，来自法国、英国、美国等18个国家的22个公共媒体共同评估了4款广泛使用的AI助理，包括：OpenAI 的 ChatGPT、微软的Copilot、谷歌的 Gemini 及 Perplexity，以测试其准确性、讯息来源及区分事实与意见的能力。

在受测的4个AI助理中，Gemini的表现最差，在76%的回答中出现重大问题，是其他助理的2倍，主要原因是它的来源表现不佳。

研究也发现，无论使用何种语言或地区，45%的AI回答至少出现一个严重错误，而每5个答案中就有1个“含有重大的准确性问题”，包括产生幻觉的细节和过时的资讯。

其中，因讯息不足等因素而生成错误或误导性资讯（俗称“AI幻觉”）是OpenAI及微软正在克服的问题。

另外，资料过时也是最常见的问题之一。

例如：当被问及“教宗是谁”时，ChatGPT、Copilot和Gemini给出的回复都是“方济各”，但当时方济各已过世，由良十四世接任。

对此，欧洲广播联盟表示，随着AI助理日益取代传统搜寻引擎成为新闻来源，公众的信任可能也因此受到破坏。

不过，即便AI助理存缺陷，路透研究所6月发布的一项全球报告却显示，15%的25岁以下青年每周从AI助理获取新闻摘要。

为了持续监测AI，欧洲广播联盟及其成员正敦促欧盟和各国监管机构执行现有法律，内容涵盖资讯诚信、数位服务和媒体多元化。

（新闻整理自《星洲日报》）