Good Luck To You!

手机扫一扫

識別美食PK,Kimi和豆包誰贏了?

鳳凰科技 2024-12-14 01:32:45 1

作者|餘楊

編輯|苗正卿

頭圖|視覺中國

有沒有發現,降溫後,下班回到樓道,家家戶戶的外賣似乎都香了很多。

這不是錯覺,更不是變饞了。

科學研究表明,一方面,寒冷天氣中,人體需要更多的能量來保持體溫,高熱量食物可以提供這些所需的能量。另一方面,在進化過程中,人類為了在食物稀缺的季節生存,會自然地增加脂肪儲備以備不時之需。雖說現在有暖氣,沒有天寒地凍的威脅,但深藏在基因裡的本能,還是會驅使人們尋求高熱量食物。

另外,食物與情緒之間存在強連結,高熱量食物如甜食可以刺激大腦釋放多巴胺,有助於緩解壓力和提升情緒。畢竟,”晚來天欲雪“的天氣,白居易下了班,也要“紅泥小火爐,能飲一杯無?”。

隨著氣溫持續走低,是選擇“貼膘”,還是繼續做控卡達人呢?

控卡首先是得掐著熱量吃飯。

但沒幾天就會發現,算熱量太累了。於是想到,AI或許可以一試。拍照讓AI估算食物熱量,管理自己的熱量攝入。

iPhone釋出後新上線的一鍵拍照呼叫 AI 功能也發掘出了這個思路。最近,躍問app因為針對iPhone16開發了一鍵呼叫相機接入 AI 提問的功能而火出了圈。

這一方面釋放出AI場景化的控卡垂類使用者訊號,另一方面也考驗著 AI 的影象分析能力。

話不多說,今天我們就來淺淺測評AI的食物熱量估算能力,push一下影象端側AI應用能力生長。

今天參與測評的選手則包括Kimi、豆包、秘塔AI和躍問。

Prompt為:假設我中午把這些都吃完了,請問我一共攝入了多少熱量,附件圖片如下。

我們先粗略估算一下參考答案。

圖中是:

一份漏奶華,大約250g,總熱量約400kcal;

一份叉燒飯,叉燒約100g,青菜約40g,滑蛋約50g,米飯150g,總熱量約600kcal;

一份烤香腸玉米蔬菜拼盤,甜玉米30g,嫩南瓜70g,烤腸120g,總熱量約400kcal;

一份咖哩魚蛋,共6個,約120g,總熱量約120kcal;

一杯港式冰奶茶,約200ml,總熱量約200kcal。

圖中所有食物熱量約為1720kcal。

餓了嗎?記住這份標答。

Kimi

首先是Kimi,大約10秒鐘Kimi就交了卷。

首先,Kimi十分懂中國人的胃,不僅準確識別了食物名,熱量估算也大致準確。把奶茶識別成了熱巧克力,倒也情有可原。

這直接抬高了我對接下來測評的期待。

豆包

然後是豆包:

豆包的食譜顯然需要豐富一下。漏奶華也許可以約等於鬆餅,咖哩魚蛋也可以約等於蘸醬了的炸丸子,但是雞蛋蓋飯上的肉直接被無視了,和標答的熱量差額也就出來了。

不過,豆包還貼心的給出了食物的方位。

秘塔AI

秘塔的回答則是:

這是目前為止唯一一個識別出烤蔬菜的AI。

秘塔正確識別了玉米、烤蔬菜、香腸、咖哩魚丸、奶茶。

漏奶華也可以約等於巧克力吐司,但芝士培根飯的芝士顏色,是不是深了點呢?

此外,秘塔的回答簡單明瞭的同時,也缺失了食物數量的描述,總體來說,我認為秘塔不善此道。

躍問

最後到躍問:

有意思的是,按照躍問的文字輸出邏輯來推算,其他的AI都是從上到下掃描識別食物,但躍問是從左到右掃描識別食物,因此奶茶在第二順位?這個細節所顯示的,可能是底層程式的差異。

另外,從躍問給出的答案來看,它對食物的尺寸和比例沒有概念,從而把漏奶華識別成了提拉米蘇。

同樣,躍問也沒有給出食物的數量,都是一塊、一杯、一份的總量詞描述,對於圖片中的同類項合併能力還尚待觀察。

語言陳述方面,我也建議,可以試著更加 AI 一些,不要“我建議你”。

總結

Kimi在食物識別和熱量估算方面表現較好,儘管有小錯誤,但總體準確。

豆包對方位更敏感,但需要豐富食譜庫。

秘塔AI在識別多樣性上表現不錯,但在食物數量和份量的描述上有所欠缺。

躍問的圖片識別邏輯可能與其他AI不同,對圖片所顯示的食物尺寸、比例、數量等變數顯然不夠敏感。

不同AI在影象分析和食物熱量估算方面的能力各有所長,也顯示在實際應用中的潛力和需要改進的短板。

總的來說,成為人類的生活助理,AI們還得加把勁兒。