{ SKIP }
文:MenClub 魏文青  
POSTED ON 30 Oct 2025

以前大家「有事問Google」,依家大家就可能已經習慣「有事問AI」,甚至有人會於網上討論時貼出AI答案當係金科玉律,認為AI講嘅嘢就一定啱。但《BBC》及歐洲廣播聯盟 (EBU) 近來公佈嘅一個最新研究,就發現市面上所有AI於處理新聞議題時有近50%機會出錯,當中包括錯誤引用、內容準確性等問題。而眾多AI中又以Google Gemini為最差。換言之,距離大家能夠靠AI提供一切答案嘅日子仍然離我哋好遠。

圖片:ImageFX

《BBC》及EBU早前進行咗一個大型研究,搵黎多名專業新聞記者去審查ChatGPT、Copilot、Gemini及Perplexity有關新聞嘅回覆,並評定AI回覆是否準確、是否有引用正確來源、能否分辦事實與意見、以及為閱讀者提供語境等。

結果就發現,有45%嘅AI回覆均有至少一項錯誤。當中31%回覆有嚴重引用錯誤,例如誤導、錯誤,又或直接缺失新聞來源引用;20%回覆則提供錯誤資訊,當中包括過期消息,以及「AI幻覺」資訊(即係AI自己作出黎嘅)等。亦即係話,如果用家無自己去做Fact Check的話,有近半機率會被AI誤導。

圖片:ImageFX

有趣嘅係,報告特別點名Google Gemini表現差劣,指其76%回覆都有錯誤,比其他高出一倍有多,而當中最主要嘅係錯誤引用問題。要留意嘅係Google依家會用Gemini為普通搜尋整理出總結,換言之佢好可能係普通人最常接觸到嘅AI。其影響亦可能係最為廣泛。

成份報告唯一正面嘅,係各大AI嘅表現其實已經比起今年2月嘅同系列研究有所改進,只係仍然唔合格咁解。《BBC》生成式AI專案總裁Peter Archer亦強調,作為新聞業者佢哋係希望AI工具能夠成功,以令更多人接觸到準確嘅新聞內容,不過目前睇黎都仲有好長條路要行。

資料來源:BBC

「動力外生骨骼」(Powered exoskeleton)老早己經唔係科幻片特有,而係現實中都存在嘅技術。不過過去相關產品都只見於軍事、醫療或工業用途,一般人可能連見都未見過,更唔好話有機會用。但黎緊大家就真係有可能於 ...
tech
【科技】Nike推外生骨骼跑「鞋」 助跑者跑更遠、更持久
28 Oct 2025
記得早排有張外國Meme圖,話大家想要嘅係AI幫手返工、做家務,人類就可以去畫畫寫歌;點知依家係AI去畫畫、寫歌,人類就可能連份工都無埋,都真係幾諷刺。不過黎到今晚今日,就終於有AI技術係幫大家處理一啲嫌惡性工 ...
tech
【科技】Kohler推AI馬桶鏡頭「Dekoda」 望實便便偵測健康
23 Oct 2025