鳳凰科技 2024-12-14 01:32:45 1
作者|餘楊
編輯|苗正卿
頭圖|視覺中國
有沒有發現,降溫後,下班回到樓道,家家戶戶的外賣似乎都香了很多。
這不是錯覺,更不是變饞了。
科學研究表明,一方面,寒冷天氣中,人體需要更多的能量來保持體溫,高熱量食物可以提供這些所需的能量。另一方面,在進化過程中,人類為了在食物稀缺的季節生存,會自然地增加脂肪儲備以備不時之需。雖說現在有暖氣,沒有天寒地凍的威脅,但深藏在基因裡的本能,還是會驅使人們尋求高熱量食物。
另外,食物與情緒之間存在強連結,高熱量食物如甜食可以刺激大腦釋放多巴胺,有助於緩解壓力和提升情緒。畢竟,”晚來天欲雪“的天氣,白居易下了班,也要“紅泥小火爐,能飲一杯無?”。
隨著氣溫持續走低,是選擇“貼膘”,還是繼續做控卡達人呢?
控卡首先是得掐著熱量吃飯。
但沒幾天就會發現,算熱量太累了。於是想到,AI或許可以一試。拍照讓AI估算食物熱量,管理自己的熱量攝入。
iPhone釋出後新上線的一鍵拍照呼叫 AI 功能也發掘出了這個思路。最近,躍問app因為針對iPhone16開發了一鍵呼叫相機接入 AI 提問的功能而火出了圈。
這一方面釋放出AI場景化的控卡垂類使用者訊號,另一方面也考驗著 AI 的影象分析能力。
話不多說,今天我們就來淺淺測評AI的食物熱量估算能力,push一下影象端側AI應用能力生長。
今天參與測評的選手則包括Kimi、豆包、秘塔AI和躍問。
Prompt為:假設我中午把這些都吃完了,請問我一共攝入了多少熱量,附件圖片如下。
我們先粗略估算一下參考答案。
圖中是:
一份漏奶華,大約250g,總熱量約400kcal;
一份叉燒飯,叉燒約100g,青菜約40g,滑蛋約50g,米飯150g,總熱量約600kcal;
一份烤香腸玉米蔬菜拼盤,甜玉米30g,嫩南瓜70g,烤腸120g,總熱量約400kcal;
一份咖哩魚蛋,共6個,約120g,總熱量約120kcal;
一杯港式冰奶茶,約200ml,總熱量約200kcal。
圖中所有食物熱量約為1720kcal。
餓了嗎?記住這份標答。
Kimi
首先是Kimi,大約10秒鐘Kimi就交了卷。
首先,Kimi十分懂中國人的胃,不僅準確識別了食物名,熱量估算也大致準確。把奶茶識別成了熱巧克力,倒也情有可原。
這直接抬高了我對接下來測評的期待。
豆包
然後是豆包:
豆包的食譜顯然需要豐富一下。漏奶華也許可以約等於鬆餅,咖哩魚蛋也可以約等於蘸醬了的炸丸子,但是雞蛋蓋飯上的肉直接被無視了,和標答的熱量差額也就出來了。
不過,豆包還貼心的給出了食物的方位。
秘塔AI
秘塔的回答則是:
這是目前為止唯一一個識別出烤蔬菜的AI。
秘塔正確識別了玉米、烤蔬菜、香腸、咖哩魚丸、奶茶。
漏奶華也可以約等於巧克力吐司,但芝士培根飯的芝士顏色,是不是深了點呢?
此外,秘塔的回答簡單明瞭的同時,也缺失了食物數量的描述,總體來說,我認為秘塔不善此道。
躍問
最後到躍問:
有意思的是,按照躍問的文字輸出邏輯來推算,其他的AI都是從上到下掃描識別食物,但躍問是從左到右掃描識別食物,因此奶茶在第二順位?這個細節所顯示的,可能是底層程式的差異。
另外,從躍問給出的答案來看,它對食物的尺寸和比例沒有概念,從而把漏奶華識別成了提拉米蘇。
同樣,躍問也沒有給出食物的數量,都是一塊、一杯、一份的總量詞描述,對於圖片中的同類項合併能力還尚待觀察。
語言陳述方面,我也建議,可以試著更加 AI 一些,不要“我建議你”。
總結
Kimi在食物識別和熱量估算方面表現較好,儘管有小錯誤,但總體準確。
豆包對方位更敏感,但需要豐富食譜庫。
秘塔AI在識別多樣性上表現不錯,但在食物數量和份量的描述上有所欠缺。
躍問的圖片識別邏輯可能與其他AI不同,對圖片所顯示的食物尺寸、比例、數量等變數顯然不夠敏感。
不同AI在影象分析和食物熱量估算方面的能力各有所長,也顯示在實際應用中的潛力和需要改進的短板。
總的來說,成為人類的生活助理,AI們還得加把勁兒。