Good Luck To You!

手机扫一扫

AI Phone的開局戰,手機拍照為什麼重要

鳳凰科技 2024-11-14 01:35:37 2

生成式AI是新的數字世界和使用者世界之間的橋樑。拍照會是智慧手機最容易告別“過度最佳化”,走向新一輪軟硬體創新起點的開始?

vivo剛剛嚐到冠軍選手該有的味道。vivo X200系列眩光門這種極限機率的問題,被關注以及廣泛討論,都是當下智慧手機末世和卷局的表現。動輒見觀瞻,以及得咎於人,始終相伴。

手機大廠豢養的評測媒體和自媒體對手機功能的評測本身,不足以公平、客觀地評價產品已經是眾人皆知。北京大學某位教授所提到的語言腐敗,是這個社會的每個人,每個行業,以及方方面面。

終有一日,大廠們要為此付出一定的代價。這一話題本身不足多論。

手機大廠們非常取巧地在共用一個“蘋果設計師”。當小米去年最早開始全面借鑑蘋果的直板復古外觀,vivo也又借鑑了小米這種直板外觀設計,X200系列沿用了這種風格。其他大廠又會繼續借鑑vivo的外觀?

庫克、雷軍、沈煒這些大廠的領袖,看來目標是一致的,就是投資效率。雖然,庫克曾經口頭對ROI這個詞加之自己和蘋果,表示過強烈的憤慨。GoogleVC的合夥人Siegler的評論十分確當,現在的iPhone就是Over-Optimized,過度最佳化。

AI影像的變化,會對手機軟硬體創新帶來機會

小米、vivo的新產品也都屬於最佳化過度,未必有太多新意。最佳化了多年的螢幕之後,現在影像似乎正在成為這群企業領袖們著力最佳化的方向,蘋果、三星、華為、小米以及此次意外事故瑕疵的vivo,都在發力這一領域。有了生成AI的技術潛力,Marc Levoy在谷歌Pixel開闢的計算影像路線,正在被幾個大廠升級到一種“智慧影像”的新高度。

vivo此前確定的賽道技術路線當中,影像是唯一表現突出的,該公司的影像負責人也已獲得了重要的晉升。幾個月前上市的谷歌Pixel 9系列,除了相機之外,幾乎沒有任何重大的提升和改善。

拋開個別公司和個別人事不論,相機會是未來一兩年,手機大廠們唯一真實在做的努力方向?

AI影像的話題價值在於,作為智慧手機最重要的功能,這個功能的AI化是否會影響到手機產品本身的進化?從所謂的智慧手機,進化到智慧手機的第一個突破口,是否會與影像相關?

簡單的邏輯,手機AI影像的升級並不會影響到智慧手機大廠們賣廣告,代理遊戲運營的收入模式,不會影響到庫克、雷軍、沈煒們的ROI,可以積極投入,而不用擔心會影響到“廣告機模式”的短期收益。

生成式AI對手機硬體型態的變化和影響,甚至超過了此前通訊制式的變化,端側智慧對本地儲存、算力、資料傳輸技術的影響已經在發生。

典型的例子是,從4G手機到5G的升級,iPhone繼續沿用了傳統的石墨片散熱方案,沿用了讓人不齒的6G記憶體方案。現在,要想手機更好地執行一個本地化的ChatGPT架構,而不是訪問一個APP,蘋果也不得不升級iPhone的儲存方案,並且對iPhone的硬體架構升級。

明年的iPhone 17系列,蘋果將會跟隨安卓生態的腳步,引入VC散熱的方案。中國大陸的一家企業,以及中國臺灣的兩家企業會蘋果供應相應的方案。此外,蘋果正在考慮一些新的VC方案。

當最佳化、過度最佳化都難以解決問題的時候,革命就會發生。此前,Marc Levoy在谷歌所開創的人像模式、夜間模式、HDR+等玩法,後來蘋果以及安卓生態發揚光大。2020年,此人在Pixel團隊的內亂時離開了谷歌,加入Adobe,繼續其計算影像之路。

Marc Levoy此後只有不多的幾次對外發言。2020年,剛剛加入Adobe時,Marc Levoy接受了The Verge的訪談當中,他談到了對計算影像技術方向的看法,不認同中國大廠們一味追求“大底”的技術路線。

他認為,未來的戰場是加速器和背後的計算能力。

也是在這一年,他因為在計算影像方面的貢獻而被授予美國工程院院士。在接受Adobe Life的訪談時,他提到了一個重要的趨勢和方向,一些原來專業的影像的處理、編輯的平臺,應用到手機上時,往往受制於硬體的效能。隨著硬體平臺技術能力的提升,計算影像的新天地在被開啟。

這一表述,發生在多模態技術剛剛興起,以及ChatGPT誕生之前。

兩年之後,再接受CNET的訪問時,Marc Levoy開始很明確地提到了Adobe和他本人正在努力的方向——在智慧手機上,用一款通用的APP軟體,為那些有一定能力的攝影者提供幫助,讓那些原來需要手動控制的功能更為方便,比如,iPhone當中的Halide,以及安卓上的Open Camera。

如今來看,安卓和iPhone生態似乎應該積極擁抱Adobe的這種創意工具軟體和生態。《智物》此前提到過,每一個智慧硬體平臺之上,會有一個全新的作業系統,用以支援使用者資料和應用之間的智慧服務,其實,就像是ChatGPT大模型和模型之上的各種middle layer的關係,替代此前安卓、iOS的應用商店模式。

回顧Adobe公司和喬布斯以及Mac生態的恩怨,在AI時代的起點,Adobe這樣的公司有幾個重要的優勢,天生對各種IT技術應用敏感,願意嘗試,更重要的是,創意人群天生具有付費的意願和能力。在生成式AI大潮之下,Adobe的股價曾經一度被打壓,跌勢兇猛。

《智物》曾經跟多個投資機構交流過,Adobe反而是最容易拿到AI時代船票的公司。過去兩年的進展來看,Adobe的進度似乎也驗證了這個看法。

Adobe傳統的軟體平臺Camera RAW目前適配支援多款手機,包括最新的iPhone 16以及三星旗艦版本,當然更是支援Marc Levoy老東家的Pixel系列,國內手機當中包括小米15系列,以及一加系列。

AI軟體對手機影像的最佳化,可能會帶來手機架構的本質變化

當智慧手機可以完善地支援自身的AI影像,以及Adobe這種原本非常複雜的影像編輯、處理軟體,會對其他的應用帶來怎樣的變化和影響?是不是會動搖到現有智慧手機運算架構系統的基礎?是否會動搖到如今,這些手機大佬們萬分不捨的APP分發和流量廣告的商業模式?

那個時候,或許應該有產品經理和創業者和投資人,不屑於再去構思“過度最佳化”的手機,而是去從新做一款手機。就像最近Marc Andreessen所提到的,不是再在一個成熟的蛋糕上撒麵粉,而是重新設計,烘焙一個新的蛋糕。

李飛飛在其自傳當中反覆提到過《第一隻眼》這本書,視覺能力在生物進化過程中所扮演的關鍵角色。手機這樣的硬體裝置,能夠具備更強的影像拍攝能力,會對整個硬體系統本身帶來如何的影響嗎?

簡單地描述這個問題。特斯拉的自動駕駛攝像頭和系統,除了規劃道路之外,也在識別整個周邊的世界,既包括行人,也包括車主,這會讓車輛的系統和架構非常不同於傳統意義上的電動車。

從這個意義上來說,多模態和生成式AI技術是使用者和數字世界之間新的橋樑,機器系統準確記錄物理世界的能力,理解物理世界的能力,和生成一個虛幻的數字世界的能力,本來就是一種能力。

接近10年前,三星、華為都曾經試圖用攝像頭感知,讓手機去識別、判斷使用者的簡單行為意圖,以今天的演算法能力,和軟硬體系統來看,會不會有新的成果?