鳳凰數碼 2024-11-14 01:39:53 4
11 月 12 日,小度科技 CEO 李瑩在百度世界 2024 上正式揭開了小度 AI 眼鏡的面紗。
在一副與傳統眼鏡幾乎無異的外形下,小度AI眼鏡不僅整合了一副耳機和一個攝像頭,更重要的是作為全球首款搭載中文大模型的原生 AI 眼鏡,在實現多模態互動的基礎上,將支援邊走邊問、識物百科、視聽翻譯以及智慧備忘等一系列AI功能。
小度的入場,也讓「AI 眼鏡」這團火燒得更旺了。
從今年伊始,大模型湧入硬體後就迅速催生出大量的 AI 硬體產品,「AI 眼鏡」作為這一賽道的熱門之一,Ray-Ban Meta 在發售半年後獲得了一百萬的銷量。與此同時,大量科技公司都在嘗試進入這個新興的領域,甚至彭博社在最近的報道中披露,蘋果內部也在推進代號「Atlas」的 AI 眼鏡專案。
這種熱情並不難理解。在 AI 眼鏡的火爆背後,其實有著一條非常清晰的邏輯:在滿足傳統眼鏡光學功能的基礎上,AI 眼鏡還可以整合開放式耳機和攝像頭,用更便捷的方式滿足了很多消費者的智慧化需求。正如從傳統手錶到智慧手錶的升級,在滿足便捷檢視時間的基礎需求之上,智慧手錶加入了更多的智慧功能。
不過,AI 眼鏡或者說智慧眼鏡並不是一個突然出現的產品,早在好幾年前,華為等其他廠商就一直在推出類似的產品——將耳機或者攝像頭整合到傳統外形的眼鏡中,但始終沒有引起消費者的興趣。而轉變背後最關鍵的變數是:
大模型來了。
簡單來說,大模型帶來了更聰明的 AI,真正意義上讓人與 AI 之間的語音互動、甚至多模態互動變得能用、好用,也讓 AI 眼鏡的智慧化升級有意義。就像如果沒有多點觸控的支援,初代 iPhone 的智慧化也無從談起。
但大模型到底讓 AI 眼鏡發生了哪些變化?一副好的 AI 眼鏡需要什麼樣的能力?小度又會在 AI 眼鏡的程序中扮演什麼樣的角色?
大模型湧入眼鏡,AI 重塑智慧體驗
很多人都需要眼鏡,這是一個不爭的事實。但當大模型湧入眼鏡,會發生什麼樣的改變?
就拿剛釋出的小度AI眼鏡來講,不僅省去了一副耳機,還整合了一顆1600萬畫素的攝像頭,可以隨時用第一視角記錄下生活和旅行中的精彩畫面。更重要的是,大模型技術的應用讓AI眼鏡能夠理解使用者的意圖,帶來革命性的多模態互動,真正超越單一功能裝置。
眾所周知,大模型帶來最大的變化之一就是更強大的自然語言理解能力,使用者當然也就願意跟AI進行更高頻的互動。正如小度今年初換上了新「大腦」——基於百度文心大模型打造的DureOS 作業系統,智慧水平有了質的飛躍,在AI 對話聊天中使用者跟小度進行多輪互動的次數,比起傳統的語音對話,整整提升了 700%。
換言之,基於大模型的「AI 智慧進化」奠定了 AI 眼鏡把語音作為主要人機互動方式的基礎,就算只是語音拍照、錄影、播放音樂/播客等體驗也會有根本的改進。
更何況,大模型還帶來了前所未有的功能和體驗升級,尤其搭配攝像頭帶來的視覺能力。比如小度 AI 眼鏡上的翻譯和總結功能,出國旅遊的時候,不管是機場、酒店的資訊,還是在餐廳看選單,都能讓小度“閱讀理解”後,為你進行講解。
在旅遊時,遇到一處陌生的建築或景點,這時候 AI 眼鏡就可以作為「AI 導遊」,結合視覺、定位以及知識庫直接介紹景點。
簡單來說,大模型驅動的 AI 眼鏡不僅人機互動變得自然、流暢,同時也在從「智慧硬體」向「智慧助手」轉變,讓使用者能夠隨時隨地,透過 AI 從不同角度、不同深度理解世界。如果還有共享使用者視覺的能力,則是更進了一步。
做好一副 AI 眼鏡,關鍵在哪裡?
放眼當下,AI 眼鏡變得越來越炙手可熱,也有越來越多新品推出,不過總的來看大抵是兩類:一類就是在AR眼鏡上透過接入大模型獲得AI能力;另一類則是基於大模型原生開發的AI眼鏡,同時整合了音訊和 AI 模組,甚至還有攝像頭,但並不搭載光學和顯示模組,典型代表就是 Ray-Ban Meta 和小度 AI 眼鏡。
這兩種 AI 眼鏡的差異不僅反映在能力的差異上,更直接關係到它們的日常體驗中。
AR眼鏡由於搭載了光學顯示模組,雖然有了顯示能力,但相對應地,重量和成本都會有明顯地增加,續航也面臨很大的挑戰,很難做到長時間配戴。
而帶攝像頭的 AI 眼鏡,雖然不支援顯示,但受益於大模型原生的智慧能力,完全可以進行更自然、順暢的人機互動,同時砍掉光學顯示模組,不僅意味著成本的降低以及續航的提升,更重要的是可以設計得更輕薄,實現更長時間的配戴,使用場景更加廣泛。
實際上我們會發現,要真正做好一副 AI 眼鏡,絕不僅僅是簡單地利用供應鏈資源進行組裝,而是涉及方方面面,根本在於軟硬體一體化,以及與大模型的深度融合。
這也是 Meta 和小度能做好一副 AI 眼鏡的關鍵基礎。小度 AI 眼鏡就搭載了基於百度文心大模型的 DuerOS AI作業系統,不僅和 Ray-Ban Meta 一樣支援視覺 AI,而且在自然語言互動、多模態感知、擬人化呈現等方面,都有極佳的表現。其次,在軟硬一體化優勢的產品定義能力上,小度打造了智慧屏、健身鏡、智慧學習機、閨蜜機等各種智慧裝置,沉澱了非常深厚的硬體能力和供應鏈資源。
不過另一方面,使用者對 AI 眼鏡智慧化的需求具有明顯的本土化特徵,語言、文化和使用場景的差異也會在一定程度上決定 AI 眼鏡的體驗。換句話說,在中國市場,AI 眼鏡必須更懂中文,更理解中國使用者的使用需求和場景。
在這一點上,國產 AI 眼鏡顯然更有優勢。尤其是小度 AI 眼鏡,背靠百度文心大模型這個全球最懂中文的大模型之一,在中文環境下能夠更準確地理解我們的意圖,生成更高質量的回答。另外小度還能無縫接入百度及⾏業夥伴豐富的資料、應⽤⽣態,進一步擴充套件AI眼鏡的“軟實力”。
同時小度也更懂國內使用者。正如前文所提到的,小度旗下裝置眾多,並且都取得了不俗的成績。按照官方給出的資料,小度各類智慧裝置目前已經覆蓋了超過 4600 萬家庭使用者。
這也正是小度 AI 眼鏡的本土化優勢所在,再加上小度、百度以及行業生態的應用支撐,讓使用者在出行、學習、辦公、娛樂、健康等與眼鏡緊密相關的場景下也能享受到全面的服務。
一言以蔽之,透過深耕中文大模型和中國使用者的實際場景需求,充分發揮自身的內容和生態優勢,小度AI眼鏡可以更加靈活、精確地滿足國內市場的多樣化應用場景。
市場爆發前夜,AI 眼鏡需要新的破局者
作為一種新品類,隨著產品的出圈、市場熱度的攀升,AI 眼鏡可以說已經有了一定的使用者認知。但 AI 眼鏡想要在國內市場普及到更廣泛的使用者群體,仍然還有很多方面需要攻克和改進。
重量、續航、影像、音訊……還有更多的功能和更強的智慧,它們共同構建的功能和體驗,每一個方面都關乎使用者對於 AI 眼鏡這個新品類的認知和接受度。這些改進當然不簡單,尤其是要在保持 AI 眼鏡輕便、長續航的同時,對軟硬體以及大模型都提出了嚴苛的要求。
所以,AI 眼鏡行業需要新的破局者,尤其是在國內市場,透過垂直整合軟硬體以及大模型的能力,解決使用者在使用中的痛點、癢點,打造一副打動中國消費者的 AI 眼鏡,從而帶動整個市場向前發展。
從這個角度來看,小度的入場不僅是自身「AI+硬體」戰略的延續,以及 AI 眼鏡的產品升級,也是在探索中國 AI 眼鏡的產品正規化,推動整個行業的迭代最佳化。