鳳凰科技 2024-12-21 01:31:54 2
快科技12月20日訊息,近日,有媒體報道,以色列特拉維夫大學的一項研究表明AI已有數字痴呆症。
在這項研究中,科學家測試了幾乎所有全球頂尖AI大型語言模型,結果都表現出類似於早期老年痴呆的認知障礙,並且版本越老,表現就越差。
為了評估實驗效果,科學家使用了經常被用來測試老年痴呆症的蒙特利爾認知評估量表,針對幾種公開的領先大型語言模型進行測試,包括ChatGPT的新老版本,Gemini新老版本等。設定的測試最高分為30分,26分或以上被認為是正常的。
實驗結果顯示,只有GPT-4o在測試中獲得了最高分26分,其次是GPT-4是25分,Gemini 1.0僅得16分。
研究還發現幾乎所有模型在視覺空間能力和執行任務方面都表現不佳,無法表現出同理心或準確解釋複雜的視覺場景。
科學家指出,所有大型語言模型在需要視覺抽象和執行功能的任務中都一致失敗,這凸顯了一個可能阻礙其在臨床環境中使用的重要弱點。因此,他們做出了有數字痴呆的AI,不可能很快取代醫生的這一結論。