鳳凰科技 2024-11-02 01:32:45 5
編者按:
一切商業競爭的核心都是組織競爭,這決定了一個公司的戰略方向和戰鬥力。作為企業的掌舵人,要在瞬息萬變的市場裡,為企業的發展摸索出一條發展之路,這其中,從組織架構調整到業務變動,都體現出掌舵人的思考和選擇。
連線Insight推出系列策劃《大佬們在想什麼》,本期將聚焦科大訊飛創始人劉慶峰,解讀在大模型浪潮下,他如何帶科大訊飛邁入“深水區”。
文/王慧瑩
編輯/子夜
2016年10月份的一個晚上,在上海梅賽德斯-賓士中心,羅永浩正忙著釋出錘子手機,沒想到這場釋出會卻讓訊飛輸入法深入人心。
一夜之間,訊飛輸入法迅速躥升到AppStore工具榜第三位,併成為排名最高的第三方輸入法,訊飛輸入法背後的科大訊飛也隨之受到熱捧。
科大訊飛不是一家年輕的創業公司,創始人劉慶峰也不是“無名之輩”。
1990年,劉慶峰放棄清華大學汽車工程系的保送名額,轉而以高於清華錄取分數線40分的成績考入中國科技大學的電子工程系;
1999年,26歲的劉慶峰拒絕了萬元美金獎學金的海外讀博機會,拒絕了微軟獎學金,轉而創立科大訊飛。
劉慶峰和科大訊飛早期員工,圖源科大訊飛微信公眾號
20多年來,從18個人的創業團隊到上市公司,科大訊飛是國內最大人工智慧技術廠商之一,也是國內科技企業的標杆。
隨著AI在行業中角色的不斷變化,劉慶峰帶著科大訊飛走過了漫長的路。這條路上,有高光和低谷,有對手和戰友,也有質疑和審視。
科大訊飛創業第二年,IDG資本合夥人林棟樑曾有意投資科大訊飛,但董事長熊曉鴿留下了一句“看起來很熱鬧就是不掙錢”的評判,雙方合作告吹。
但最終,科大訊飛證明了自己,成為中國人工智慧的龍頭企業,劉慶峰提到,科大訊飛走出了一條“彎曲的直線”:彎曲,是指具體的路徑非常曲折;直線,是指目標和戰略明確且清晰。
2022年底,ChatGPT的出現引領生成式人工智慧的爆發,劉慶峰也決定大幹一場。
過去一年多時間,從訊飛星火1.0版本到訊飛星火4.0 Turbo,從技術到多模態互動再到落地場景,科大訊飛高歌猛進,成為國產“百模大戰”的先鋒。
尤其是今年,大模型商業化落地迎來加速期,行業進入深水區,淘汰賽加劇的同時,科大訊飛的投入有了效果。今年第三季度,科大訊飛營收同比增長,淨利實現轉正。
“燃燒最亮的火把,要麼率先燎原,要麼最先熄滅”。2001年科大訊飛生死攸關的“半湯會議”上,劉慶峰如此說道。
這兩年,劉慶峰有了新的思考,“唯有自主可控的生態,才有生生不息的未來。”
對技術堅持多年的原動力,是劉慶峰對AI行業熱愛與初心,而對技術堅持多年的結果,是劉慶峰帶領科大訊飛邁入複雜深水區的底氣。
大模型應用落地,
劉慶峰要帶科大訊飛邁入“深水區”
公司14週年慶典當天,劉慶峰請全體員工看了《中國合夥人》。
他希望這些平均年齡不到30歲,和他當年創業一樣的年輕人們,從影片中看到兩點:遠見和堅持。
就像當年自己堅持做語音一樣。
2001年,成立不到兩年的科大訊飛舉步維艱,而彼時房地產、遊戲等行業風生水起,相比之下語音技術門檻高、難掙錢,因此有人建議科大訊飛也去佈局相關產業。
在當年的“半湯會議”上,劉慶峰卻直言:訊飛應該做訊飛該做的事,“凡不看好語音的,請你離開。”
2001年訊飛年度計劃總結會,圖源科大訊飛微信公眾號
也是這個會議,讓科大訊飛確定了戰略方向——不僅要做好智慧語音、做好人工智慧,還要代表中國參與全球競爭。
這條路不好走。科大訊飛的佈局之路並不順利,營收規模也一直在百億左右。
難得的是,科大訊飛在AI這條路走下去的決心沒有變。
2023年ChatGPT掀起的大模型風口,科大訊飛的機會來了。
當時,劉慶峰借了一個賬號體驗了ChatGPT,立刻決定All in。科大訊飛的研究院抽調了最強大的團隊,研究科大訊飛版大模型,同時同步推進應用落地。
自去年5月6日首次釋出以來,訊飛星火大模型經歷了多次迭代,到今年10月24日科大訊飛全球1024開發者節上,訊飛星火已更新至4.0 Turbo版本。
據科大訊飛方面介紹,根據真實資料背靠背的測試,訊飛星火4.0 Turbo七大能力全面超過GPT-4 Turbo,數學能力、程式碼能力超過GPT-4o,國內外中英文14項主流測試集中實現9項第一。
圖源科大訊飛微信公眾號
從全球的行業發展來看,經歷了快兩年的“百模大戰”,資本進入冷靜期,行業邁入深水區,單純的技術引數和空泛概念都不足以支撐大模型產業進入下一階段,規模化的應用落地成為玩家們新一輪比拼的關鍵。
換言之,再高的技術門檻和算力水平,也要以滿足大模型規模化落地為基本需求。
“未來AI技術的探索,必須大規模產業化,必須在場景中進入到真正的深水區,所有玩‘概念’的都不會有大未來。”劉慶峰在今年1024科大訊飛全球開發者節的演講中表示。
今年10月24日,科大訊飛釋出了10項基於訊飛星火底座能力的硬核產品與創新應用,又在科博展上集中展示了200多項大模型落地應用產品,涵蓋教育、醫療、汽車、金融、工業、企業、個人助手等數百個場景。
比如,在辦公領域,繼訊飛翻譯機後,科大訊飛正式釋出多語種AI翻譯透明屏;在工業領域,VIAS智慧座艙人機互動效果測評機器人可以用AI助力汽車的整車檢測;在教育領域,阿爾法蛋圍棋機器人可以更靈活應對兒童在圍棋教育中的個性化反應……
落地不是一朝一夕的事。作為國產大模型廠商,科大訊飛技術的先發優勢毋庸置疑,但伴隨行業進入場景化落地的深水區,想要在這場戰役之中取得優勢,還要回歸到商業落地和本身。
走到這一步,
劉慶峰帶科大訊飛跨過多少檻?
一路走來,劉慶峰很清楚自己從事的行業面臨的激烈競爭,喜歡並享受競爭的感覺。
20多年前,做語音技術時,他的對手是微軟、谷歌等公司,如今昔日的對手成長為巨頭,劉慶峰又迎來了新的對手。
2022年底,ChatGPT的出現,讓劉慶峰有了更清晰的目標——全面對標ChatGPT,但要帶科大訊飛做出自主可控的模型。
這場“百模大戰”,國內科技公司都帶著自己的產品參賽,模仿ChatGPT已經不是難事,誰能做出更好的“中國大模型”才是這場競賽的焦點。
劉慶峰的思路很清晰:技術上對標,科大訊飛在第一次大模型釋出會時就給出最詳細的技術進步時間表,並如期兌現。
去年5月6日,科大訊飛釋出了星火大模型的1.0版本,當時劉慶峰放話,星火大模型要在10月份對標ChatGPT(GPT 3.5)。
劉慶峰給出了詳細的時間表,預計2023年內會進行三次升級,分批次增強數學能力、補足程式碼能力,不僅要在中文上超越,還要在英文上達到和ChatGPT一樣的水平。
五個月後,科大訊飛釋出“訊飛星火”認知大模型V3.0,劉慶峰激動地表示“我們如期兌現了自己給大家的時刻表。”
到了今年上半年,科大訊飛對標GPT-4。“6個月內,我們可以達到現在全世界最好的GPT-4最優的水平”,劉慶峰又給出了新的目標。
6月27日,科大訊飛釋出星火大模型V4.0,模型能力有了巨大的提升,其在底座能力上已全面對標GPT-4 Turbo。
前不久的10月24日,劉慶峰再次更新科大訊飛的成績單。
一次次升級的背後,離不開各種引數的較量,但其他廠商不一樣,從一開始劉慶峰就認為大模型的落地化應用比較重要。即便是百模大戰初期,科大訊飛除了列舉引數外,還將重點放在了大模型在自家產品的應用中。
像學習場景下,訊飛旗下多款AI學習機也搭載了大模型,實景對話、寫作高階批改等能力均有提升;辦公場景下,對傳統語音轉寫業務做進一步升級,透過大模型的自然語言處理能力實現自動會議紀要、語篇規整、一鍵生成文稿等功能。
擺在大模型科技公司面前的問題是,產品從走出實驗室到面向市場規模化生產需要時間和成本訓練,最終會有多少使用者為此買單也是未知數,但真金白銀的投入不能停。
這對科大訊飛來說無疑是壓力。過去一年,由於不斷加大對大模型的投入,科大訊飛仍在虧損。
今年上半年,科大訊飛實現營業收入93.25億元,同比增長18.91%,歸屬於上市公司股東的淨利潤虧損4.01億元,上年同期淨利潤為7357.2萬元,同比由盈轉虧。
科大訊飛在公告中表示,虧損是由於上半年在大模型研發、核心技術自主可控和產業鏈可控,以及產業落地拓展等方面新增投入超6.5億元,同時投資收益及公允價值和其他收益同比減少,計提壞賬準備同比有所增加。公告顯示,科大訊飛上半年研發投入21.9億元,同比增加32.23%。
在劉慶峰看來,加大研發投入是出於對大模型未來的信心。“如果我們選擇保守,把這些投入都省掉,好像利潤馬上就出來了。我們不是不瞭解,我們數學都好得很,這麼多年創業我們又都是公司股東,憑什麼不這麼幹?為什麼我們在很多地方要去探索?就是因為我們不想錯失這次重大的革命機遇,跟所有的頂尖玩家站在同一個平臺上。”
今年三季度,劉慶峰口中對未來的信心就初現曙光。科大訊飛第三季度財報顯示,2024年第三季度實現營業收入55.25億元,同比增長15.77%;歸屬於上市公司股東的淨利潤5696.14萬元,同比增長120.87%,單季度淨利轉正。
科大訊飛走到現在這一步,離不開劉慶峰的思考。面臨和對手的差距時,劉慶峰會“迎頭趕上,我們知道怎麼做”;面臨市場對其科技投入的質疑時,劉慶峰說,“過去半年把大模型的脾氣摸透以後,是我們今天最有底氣的地方。”
自大模型風起,一改往日幕後操盤手的低調,科大訊飛每一次大模型釋出會都有劉慶峰的身影。這個AI界的“三好學生”又像年輕時候做語音技術那樣,甩開膀子,大幹一場。
五個關鍵詞,
劉慶峰要帶科大訊飛走到哪?
如果拆解劉慶峰這類理工學霸們的創業之路,會發現他們是敢想敢幹、有遠大抱負的人。
尤其是在創業熱潮的年代,在學校裡做成績卓越的優等生往往滿足不了他們,學霸們心中都住著一個“比爾蓋茨”“喬布斯”。
時間追溯到1992年。數理成績優異的劉慶峰還在讀大二,被導師王仁華教授挑選到中國科學技術大學人機語音通訊實驗室。在這裡,機器人可以開口說話,劉慶峰內心也種下了語音產業理想的種子。
時至今日,談及科大訊飛語音技術能做到全國乃至全球頂尖,劉慶峰仍歸功於當年對語音及AI產業的信任。
劉慶峰直言這是企業家精神。“因為相信所以看見”,而不是“因為看見所以相信”,心中有一團火,相信產業的未來,所以看得見路怎麼走,看得見未來的希望。
劉慶峰心中的這團火不曾熄滅。科大訊飛全球1024開發者節開幕式上,劉慶峰在演講結尾強調,未來 AI 產業發展的關鍵是五個關鍵詞:頂天立地、自主可控、通專結合、端雲聯動、軟硬一體。
圖源科大訊飛微信公眾號
細分這五個關鍵詞,更多的是劉慶峰對AI產業落地的思考。
所謂頂天立地,即從源頭技術創新,要國際領先對標全球最好的底座模型,對標全球最好的專業模型,做到全球第一;
立地,必須大規模產業化,必須在場景中進入到真正的深水區;
自主可控,所有玩概念的都不會有大未來,只有自主可控才有大未來;
通專結合,通用模型和專用模型的結合,讓它效率更高,專業領域效果更好;
端雲聯動、軟硬體一體,真正解放生產力,釋放想象力。
五個關鍵詞的背後,是一個務實主義者的堅持。
首先,從技術上看,科大訊飛有自己的堅持。
過去兩年,大模型行業有兩個重要的時間節點,一個是ChatGPT的出現,另一個是Sora的出現。
前者出現時,科大訊飛立下全面對標的“軍令狀”,當Sora推出生成影片能力時,劉慶峰並不著急跟進。劉慶峰認為,對於大模型的多模態能力,生成影片只是娛樂,更優先順序的是進入工業場景、生活場景、家庭陪伴機器人等具身智慧。
接受《中國企業家》採訪時,劉慶峰表示,“大模型的多模態理解能力比多模態生成更重要,我們也有推出Sora的類似計劃,但這個計劃要排在通用大模型後面一點。”
從大模型核心底層技術“預訓練模型”來看,進入2024年,多方面因素的限制之下,不少大模型公司傳出放棄預訓練模型的訊息。科大訊飛是少有堅持做預訓練模型的廠商。
預訓練模型是個技術活,對人才、技術、成本要求都很高。像零一萬物CEO李開復提到,預訓練模型需要有懂晶片的人、懂推理的人、懂基礎架構的人、懂模型的人以及懂演算法的人,大家一起做才行。
這也意味著,不是每家公司都有能力做這件事。2019年開始做預訓練模型的科大訊飛,至今仍在不斷迭代。科大訊飛研究院院長劉聰在接受36氪採訪時表示,訊飛的大語言模型會堅持迭代,在類似於o1大模型、多模態互動、語音端到端等方面持續佈局。
此前,劉慶峰曾在多個場合強調,在中美科技人工智慧博弈的背景下,國產大模型底座的能力和支撐,決定了能否在這一波人工智慧浪潮中享受更多紅利。
這一思路下,訊飛星火是國內第一個、也是唯一一個基於全國產算力底座訓練出的大模型。此次開發者大會上,科大訊飛還推出了與華為、合肥市大資料資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”。
科大訊飛表示,去年的“飛星一號”解決了500次以上的基礎軟硬體問題和模型適配問題,今年的“飛星二號”將帶來新模型新演算法的持續適配和智算叢集規模的再次躍遷。
其次,從規模化落地來看,和很多大模型廠商一樣,科大訊飛也在B端、C端兩條腿走路。
B端層面,截至目前,已有41.5萬餘家企業客戶使用科大訊飛星火創新應用。“訊飛星火已成為央國企大模型的第一選擇。”劉慶峰表示。
據劉慶峰介紹,科大訊飛有領先的工具鏈,可大幅提升“理資料、訓模型”的效率;有覆蓋300+行業場景的實際應用案例,已形成相互借鑑和複用的規模化效應。”
C端層面,在訊飛星火大模型賦能下,C端硬體銷量增長。今年前三季度,科大訊飛學習機銷量、消費者與開發平臺業務、智慧汽車業務分別增長超100%、44%以及49%,較好地抵消了G端業務如智慧城市資訊工程收入下降的影響。
在整體生態上,2024年前三季度,訊飛星火大模型新增開發者數量達177.7萬。七麥資料顯示,訊飛星火App在安卓端的下載量超過1.9億次。
2019年科大訊飛成立20週年時,劉慶峰在《20週年給全體訊飛人的一封信》中對人工智慧未來十年做了展望,指出了三大趨勢:語音將成為最重要的人機互動方式、人類語言巴別塔將在十年內最終建成、人工智慧將為各行業賦能。
到今天,劉慶峰的想法依舊沒變,ChatGPT時刻的出現讓他對AI產業的未來更有信心。他想帶科大訊飛走過的不僅是技術和場景落地,更是用人工智慧技術滿足人們對未來的嚮往。
不過,實現這些的前提需要一個更有戰鬥力的科大訊飛。距離科大訊飛未來五年要達到“十億使用者、實現千億收入、帶動萬億產業生態”的目標還有兩年,走進“深水區”,劉慶峰註定要關關難過、關關過。