蘋果AI研究：“獼猴桃”簡單算術考倒o1和Llama等20多個最先進模型

鳳凰科技 2024-11-03 01:33:29 5

IT之家 11 月 2 日訊息，《洛杉磯時報》昨日（11 月 1 日）釋出博文，報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型，發現在有干擾項存在的情況下，它們處理簡單的算術問題時表現不佳，甚至不如小學生。

蘋果公司用以下這道簡單的算術題測試 20 多個最先進的 AI 模型，IT之家附上題目如下：

Oliver 在星期五采摘了 44 個獼猴桃、然後他在星期六採摘了 58 個獼猴桃，星期日採摘的數量是星期五的兩倍，不過其中有 5 個獼猴桃的塊頭要比平均值要小，請問 Oliver 這三天共摘了多少個獼猴桃？

正確答案是 190 個，計算公式為 44（星期五）+58（星期六）+88（44*2，星期日）。

不過測試的 20 多個最先進 AI 模型無法排除干擾項，通常不理解獼猴桃的大小和數量無關，大部分的結果是 185 個。

蘋果團隊發現，當問題包含看似相關但實際上無關的資訊時，AI 模型的表現急劇下降。對此研究認為，AI 模型主要依賴於訓練資料中的語言模式，而非真正理解數學概念。

蘋果的研究表明，目前的 AI 模型“無法進行真正的邏輯推理”。這一發現提醒我們，儘管 AI 在某些任務上表現出色，但其智慧並不如表面看起來那樣可靠。

蘋果團隊指出，簡單地擴充套件資料或計算能力並不能根本解決這個問題，蘋果的論文並非旨在削弱對 AI 能力的熱情，而是提供一種理性的認知。

蘋果 ai 研究獼猴桃簡單算術考倒o1 llama等20 多個最先模型