鳳凰科技 2024-11-15 01:33:43 2
文|戴菁
一年一度的百度世界大會,已經成為觀察百度AI戰略動向以及行業趨勢的一個視窗。
在2024百度世界大會上,李彥宏看起來比去年更為篤定。他說,基礎模型能力就緒,我們即將迎來AI應用的群星閃耀時刻。
當2023年下半年大模型混戰逐漸出現分野,李彥宏就提出「卷模型不如卷應用」。但從隨後的行業發展動態來看,國內應用之「卷」集中在了類ChatGPT的AI助手層面,其他領域出現顛覆式創新的AI應用鳳毛麟角。
其中一個原因,創新是有認知門檻的,開發AI應用也是有技術門檻的。
或許是意識到了這一點,李彥宏和百度今年進一步向大模型戰略聚焦,押注智慧體的爆發。
如果現在要問百度的第一性原理是什麼,答案越來越清晰——應用驅動。李彥宏還給這個「應用驅動」加了一個有別於移動網際網路時代的註解,「不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數百萬‘超級有用’的應用。」
01
「做工程不丟人」
過去24個月,萬眾期待的AI超級應用還是沒有蹤影。一些人不禁懷疑:全球性的大模型狂熱究竟是一場新的技術革命,還是新一輪泡沫?
但如果默唸茨維格在《人類群星閃耀時》中所寫的:「那些歷史的尖峰時刻都需要太長的醞釀時間,每一樁影響深遠的事件都需要一個發展的過程」,旁觀者或許會更篤定一些。
作為這股AI浪潮最早和最深的參與者,李彥宏提前看到那個「尖峰時刻」。他對AI應用即將爆發的判斷,主要依據有兩個:
其一,底層技術突破。過去24個月,AI行業最大的變化是大模型基本消除了幻覺,回答問題的準確性大幅提升。基於檢索增強技術的進展,百度年初切入iRAG(image based RAG)——即檢索增強的文生圖技術,進一步讓文生圖也能消除幻覺,從而讓AI在影視、漫畫、連續畫本、海報製作等領域落地。
▲根據「愛因斯坦在天壇」提示詞生成的圖片
左為文心iRAG作品 右四均為其他大模型生成作品
其二,大模型呼叫量爆發,開發者覺醒。今年5月,文心大模型API日呼叫量達到2億。當時百度高管們在會上討論一個問題,大模型怎麼就算「成了」?李彥宏給出的量化指標是,日均API呼叫量一年內漲10倍。這說明大家是真需要。到11月初,文心大模型的API日呼叫量超過15億,比預期發展快了不少。
還有一個現實原因是李彥宏會上並未展開的——呼叫成本。過去兩年內,大模型每個Token的使用成本下降了超過 99%。以美國為例,現在大模型處理100萬個Token的成本僅為60美分。在國內,百度的一些模型甚至免費提供。
從會上傳遞的資訊來看,百度目前重點押注兩大應用方向:面向to C端的智慧體,以及面對to B端的產業應用。
據我們觀察,在to C端,大模型技術應用的廣度可能比技術樂觀派的預期還要高,因為許多使用場景並不侷限於App等傳統產品形態。
比如我的一名律師朋友,有時會讓AI幫著做一個簡單的法律協議,他自己改改就能交給客戶。如果是其本人擬這份協議,最起碼要用半小時。完成這一互動,他甚至不用專門下載AI工具類App,只透過一個法律行業公眾號就能輕鬆獲取。
可以說,AI應用場景無處不在,但產品形態未必跟從前一樣。去年在大模型爆發之初,人們就憧憬著AI的iPhone時刻將在大模型領域復刻,諸如移動網際網路時代的《憤怒的小鳥》、Instagram等超級應用,也會很快在大模型領域出現。
一年後,超級AI原生應用還沒有出現,但新的共識逐漸形成:智慧體將會成為AI應用的主流形態——
數月前,OpenAI發文稱,在谷歌、蘋果等科技巨頭的帶動下,2025年將是AI Agent最終成為主流的一年。在百度世界大會上,李彥宏再次給出智慧體的判斷:智慧體是大模型最重要的發展方向,即將迎來它的爆發點。
按照AGI的進化順序框架,智慧體被視為Copilot的下一個階段,它們具備一定自主性,能夠執行長期任務,比如與環境進行多次互動、協同工作等,並且擁有自我進化能力。
目前全球很多頂尖科技公司都在關注智慧體,但李彥宏在會上透露,百度已經把智慧體作為大模型的最重要戰略方向。
理由就在於,智慧體的門檻足夠低,天花板又足夠高。去年行業已經意識到應該卷應用,但具體怎麼做、怎麼從模型變成應用,這裡面有太多不確定性,也讓很多人望而卻步。從移動網際網路時代的產品形態變化來看,每一次降低產品門檻,都會帶來一個應用正規化的爆發。最典型的是從App到小程式的遷移,微信生態從中受益匪淺。
智慧體也有相似之處。當平臺為開發者提供了一個高效、簡單的路徑,在大模型上構建智慧體越來越方便,「勢」就會匯聚起來。像文心智慧體平臺上,目前已吸引了15萬家企業和80萬名開發者,每週都有上萬個新的智慧體被創造出來,其中還有11歲小學生創造的智慧體,然後透過搜尋和其他渠道分發出去。
不過從李彥宏的發言來看,百度不是要推出一個超級應用,而是要幫助更多人、更多企業打造數以百萬「超級有用」的應用。
言外之意,百度在AI時代的生態護城河寬度,未來要靠這些應用來構建了。
由此就不難理解,為什麼AI領軍人物中沒有比李彥宏更著力於應用落地的人了。百度的AI優勢,更多體現在底層技術和模型層。而技術的成功與否,最終取決於它在真實生活中的應用。就像DeepMind 創始人、微軟AI CEO蘇萊曼在最近的一次交流中所強調的,一個沒有明確用途的AI模型,不過是一個引人入勝的電腦科學展示。
02
「自由畫布」式的智慧體
開始湧現
智慧體的爆發離不開「有用」。
李彥宏此前提醒,要避免掉入「超級應用」的陷阱。在AI時代,「超級能幹」的應用恐怕比只看DAU的「超級應用」更重要。
結合國內主要智慧體平臺上的案例來看,目前公司類智慧體、角色智慧體、工具類智慧體、行業智慧體是幾個主要發展方向。
這其中,公司類智慧體被認為是於AI時代的公司官網。結合百度的搜尋引擎底色,我們認為,這一類智慧體是百度搜尋的增量機會所在,公司類智慧體是百度升級與KA客戶關係、提供更多價值的一個觸點。
據百度官方資料,比亞迪的官方智慧體上線後,銷售線索轉化率提升了119%。
不過在整場世界大會中,參會者最感興趣、最能讓人眼前一亮的當屬工具類智慧體「自由畫布」。這個由百度文庫和百度網盤聯合釋出的AI創作新物種,在面向公眾開啟邀測首日,已吸引超20萬人排隊預約。
根據現場演示,「自由畫布」就是一個由文心多模態大模型加持的萬能白板,是百度文庫、百度網盤行業首創的內容作業系統。
透過大模型技術,「畫布」打通了公域與個人授權的私域內容,透過「一拖一圈」的極簡操作,實現對多格式、全模態檔案的混合理解、生成、創作,並支援對富媒體文件的一鍵分享和儲存,實現了輸入、編輯、創作、分享自由。
今年9月,百度集團宣佈,網盤C端業務重新劃歸移動生態事業群組(MEG),並由百度副總裁、文庫事業部負責人王穎接管。如果當時不少人還對這一決策邏輯感到不解。如今「畫布」揭幕,透過AI能力進一步打通和重構,文庫和網盤已經成為全新的智慧生產力。
在上述四類智慧體中,從商業化角度,《降噪NoNoise》同樣關注行業智慧體的前景。僅以保險行業為例,此前有專注大模型to B方向的AI創業者告訴我們,在這個30萬億規模的市場,部分保險經紀人的佣金能佔到客戶投保金額的20%-40%。如果大模型將保險專業知識沉澱為AI產品,繼而能在一些簡單險種上為客戶制定投保方案,會非常有前景。
比如號稱「免費AI律師」的法律智慧體「法行寶」,上線半年已經回答超1660萬個法律問題。產品資訊顯示,該智慧體由百度自己下場創造的,主介面提供對話互動以及法律計算器、智慧法律文書、線上法律意見書等免費工具,還有相似判決案例連結可以查閱。
比如使用者可以就一起交通事故、一次工傷,詢問賠償方案、如何計算索賠金額,也可以請智慧體代寫一份起訴書。以往有這些法律諮詢方面的需求時,普通人要麼付費求助於專業律師,要麼自己在繁雜的網際網路中搜尋,但要同時承擔資訊不全或者不準確的風險。
當然也有律師指出,基於專業知識積累和個人經驗而提出的法律策略、分析判斷等專業法律服務,是AI目前還很難做到的地方。
換個角度想,這或許正是智慧體未來的想象空間,因為智慧體本身是一個有自主性、會持續學習和進化的產品形態。
不過有必要指出的是,並非基礎設施齊備了,就會出現智慧體的湧現。一個應用方向的爆發,離不開清晰的商業化刺激。2012年,當《憤怒的小鳥》登陸iOS平臺並且大獲成功後,透過iOS端的下載付費和安卓端的廣告植入,其背後的遊戲開發公司當年收入較上一年增長101%,達到1.5億歐元。
關於這一點,OpenA聯合創始人山姆·奧特曼也有預警。在最近一次專訪中,他不忘提醒創業者:透過更快地擁抱新技術,你可能會獲得短期的爆發式增長,但長期來看,你仍然需要構建一個能持續提供價值的產品或服務。「每個人現在都能做出非常棒的演示,但要真正構建一個成功的商業,那才是關鍵所在。那是最艱難的部分,而商業規則仍然適用。」
據我們瞭解,目前文心智慧體平臺已經逐步跑通商業閉環,實現智慧體從開發,到分發,再到變現。單個智慧體的單次轉化最高收入達到了10萬元,其背後是連結掛載、商品轉化、線索轉化、聯盟廣告和膠囊位等商業元件的全方位支援。
03
長期主義、理想主義、現實主義
缺一不可
中美AI巨頭經常被拿來對比。相比美國AI同行對於AGI的宏大願景、以科學研究和底層突破為驅動的做法,從世界大會上的表態來看,百度是典型的工程思路、應用驅動。
會後接受《甲子光年》專訪時,李彥宏直言,「做工程不丟人。做工程很有可能是比科學更早發現機會、發現規律的。」就像飛機是先飛上天了,人們才開始研究,原來有一個東西叫空氣動力學。所以百度的AI路線是優先解決大家在場景和應用中遇到最多的技術問題。
乍看上去,這與李彥宏的社會標籤有一定反差。百度10年1700億研發投入的故事已經為公眾所熟知,李彥宏的「長期主義」、「未來主義」標籤也早已得到業內認可。
比如去年9月,李彥宏同馬斯克、黃仁勳、奧特曼一起入選《時代》週刊全球AI領袖時,《時代》的評語就是,「李彥宏是中國最傑出的未來主義者,長期投身於AI發展的浪潮。」在近期沙利文釋出的《2024年全球AI生態全景概覽》報告中,百度被列入AI-Native Giant,與谷歌、OpenAI位於同一象限。
未來主義少不了理想色彩,但應用驅動的策略看起來又很現實。
看似矛盾的地方,或許取決於參與者如何看待人工智慧革命的本質。如果AI會帶來一次新的工業革命,那這場變革不是三五年就能結束的,可能會在未來幾十年持續向社會的方方面面去滲透。作為置身其內的變革參與者,既需要耐心,也少不了源源不斷的、真金白銀的投入,然後以商業上的成功、生態上的高牆,保持在全球競爭中的頭部位置。
正如李彥宏在此前受訪時所預判的:未來兩到三年,AI競爭會非常激烈,「至於說誰會是最後的贏家,我的看法是誰賺錢誰就能活下來。」
這或許是李彥宏不厭其煩的佈道、呼籲大家做智慧體、把AI用起來的一個初衷;也是百度一邊自己下場做「自由畫布」「法行寶」等智慧體應用,一邊做工具、做基礎平臺,不斷去降低開發者應用開發門檻的動機。
比如世界大會上的另一個重磅釋出——無程式碼開發工具「秒噠」,這個被李彥宏稱為「迄今為止人類歷史上最複雜的多智慧體協作工具」,為的就是讓每個人都具備程式設計師的能力,會說話就能做出應用。此前在設計領域,海外的Cursor和Replit等產品已經實現在不敲程式碼的情況下,只靠使用者的自然語言指令就能生成應用介面。
▲百度釋出的無程式碼工具「秒噠」,只要用中文描述需求,並補充一份帶有大會時間地點主題的文件,就可以指揮多個智慧體協作,完成報名系統的開發。
這類工具又個共通的底層邏輯——讓普通人靠創意就能賺錢。如果類似想法能夠落地,AI應用無疑距離大規模爆發更近一步。我們也注意到,儘管「秒噠」明年一季度才會上線,據悉已經吸引超過5000家企業排隊測試。
沿著前面的思路,同樣可以理解百度為什麼沒在OpenAI的Sora驚豔出場後,投入到中國版Sora的競爭當中。在李彥宏看來,Sora和多模態是兩回事。Sora本質上是任意場景下的影片生成能力,這件事非常有意義,但真正做到需要長期燒錢。
但這並不意味著百度不做多模態,「我們非常非常看好多模態,也在多模態上有非常長期的投入,在真正有應用場景的地方,我們的多模態能力是非常強的。」 百度只是選擇更落地的方向推進。比如「自由畫布」,便是多模態AI功能all in one的平臺。
李彥宏在大會當日的專訪尾聲被問及有何寄語,他談到,人工智慧的革命不是三五年就結束,它更像是三五十年對於社會的全方位重構。需要長期主義、理想主義和現實主義三者相結合。
對於百度來說,未來與現實,或許正是AI戰略的一體兩面。