Good Luck To You!

手机扫一扫

識別美食PK，Kimi和豆包誰贏了？

鳳凰科技 2024-12-14 01:32:45 1

作者｜餘楊

編輯｜苗正卿

頭圖｜視覺中國

有沒有發現，降溫後，下班回到樓道，家家戶戶的外賣似乎都香了很多。

這不是錯覺，更不是變饞了。

科學研究表明，一方面，寒冷天氣中，人體需要更多的能量來保持體溫，高熱量食物可以提供這些所需的能量。另一方面，在進化過程中，人類為了在食物稀缺的季節生存，會自然地增加脂肪儲備以備不時之需。雖說現在有暖氣，沒有天寒地凍的威脅，但深藏在基因裡的本能，還是會驅使人們尋求高熱量食物。

另外，食物與情緒之間存在強連結，高熱量食物如甜食可以刺激大腦釋放多巴胺，有助於緩解壓力和提升情緒。畢竟，”晚來天欲雪“的天氣，白居易下了班，也要“紅泥小火爐，能飲一杯無？”。

隨著氣溫持續走低，是選擇“貼膘”，還是繼續做控卡達人呢？

控卡首先是得掐著熱量吃飯。

但沒幾天就會發現，算熱量太累了。於是想到，AI或許可以一試。拍照讓AI估算食物熱量，管理自己的熱量攝入。

iPhone釋出後新上線的一鍵拍照呼叫 AI 功能也發掘出了這個思路。最近，躍問app因為針對iPhone16開發了一鍵呼叫相機接入 AI 提問的功能而火出了圈。

這一方面釋放出AI場景化的控卡垂類使用者訊號，另一方面也考驗著 AI 的影象分析能力。

話不多說，今天我們就來淺淺測評AI的食物熱量估算能力，push一下影象端側AI應用能力生長。

今天參與測評的選手則包括Kimi、豆包、秘塔AI和躍問。

Prompt為：假設我中午把這些都吃完了，請問我一共攝入了多少熱量，附件圖片如下。

我們先粗略估算一下參考答案。

圖中是：

一份漏奶華，大約250g，總熱量約400kcal；

一份叉燒飯，叉燒約100g，青菜約40g，滑蛋約50g，米飯150g，總熱量約600kcal；

一份烤香腸玉米蔬菜拼盤，甜玉米30g，嫩南瓜70g，烤腸120g，總熱量約400kcal；

一份咖哩魚蛋，共6個，約120g，總熱量約120kcal；

一杯港式冰奶茶，約200ml，總熱量約200kcal。

圖中所有食物熱量約為1720kcal。

餓了嗎？記住這份標答。

Kimi

首先是Kimi，大約10秒鐘Kimi就交了卷。

首先，Kimi十分懂中國人的胃，不僅準確識別了食物名，熱量估算也大致準確。把奶茶識別成了熱巧克力，倒也情有可原。

這直接抬高了我對接下來測評的期待。

豆包

然後是豆包：

豆包的食譜顯然需要豐富一下。漏奶華也許可以約等於鬆餅，咖哩魚蛋也可以約等於蘸醬了的炸丸子，但是雞蛋蓋飯上的肉直接被無視了，和標答的熱量差額也就出來了。

不過，豆包還貼心的給出了食物的方位。

秘塔AI

秘塔的回答則是：

這是目前為止唯一一個識別出烤蔬菜的AI。

秘塔正確識別了玉米、烤蔬菜、香腸、咖哩魚丸、奶茶。

漏奶華也可以約等於巧克力吐司，但芝士培根飯的芝士顏色，是不是深了點呢？

此外，秘塔的回答簡單明瞭的同時，也缺失了食物數量的描述，總體來說，我認為秘塔不善此道。

躍問

最後到躍問：

有意思的是，按照躍問的文字輸出邏輯來推算，其他的AI都是從上到下掃描識別食物，但躍問是從左到右掃描識別食物，因此奶茶在第二順位？這個細節所顯示的，可能是底層程式的差異。

另外，從躍問給出的答案來看，它對食物的尺寸和比例沒有概念，從而把漏奶華識別成了提拉米蘇。

同樣，躍問也沒有給出食物的數量，都是一塊、一杯、一份的總量詞描述，對於圖片中的同類項合併能力還尚待觀察。

語言陳述方面，我也建議，可以試著更加 AI 一些，不要“我建議你”。

總結

Kimi在食物識別和熱量估算方面表現較好，儘管有小錯誤，但總體準確。

豆包對方位更敏感，但需要豐富食譜庫。

秘塔AI在識別多樣性上表現不錯，但在食物數量和份量的描述上有所欠缺。

躍問的圖片識別邏輯可能與其他AI不同，對圖片所顯示的食物尺寸、比例、數量等變數顯然不夠敏感。

不同AI在影象分析和食物熱量估算方面的能力各有所長，也顯示在實際應用中的潛力和需要改進的短板。

總的來說，成為人類的生活助理，AI們還得加把勁兒。

識別美食 pk kimi 豆包誰贏了

識別美食PK，Kimi和豆包誰贏了？

相關文章