Good Luck To You!

手机扫一扫

2025年必卷的AI應用——AI程式設計會如何發展?

鳳凰科技 2025-01-07 01:32:13 2

整理 | 宛辰

編輯 | 靖宇

2024 年底,Cursor 以 26 億美元估值完成了 1 億美元融資,四個月內估值漲了 6.5 倍。更早之前,另一家主打「AI 程式設計師」的創業公司 Devin 在還沒有產品推出、只有宣傳片的情況下,就以 20 億美金的估值籌集了 1.75 億美元。

這樣的例子還有很多。過去一年,程式碼領域的 AI 應用層出不窮,你肯定見過這些名字,Github Copilot、Claude3.5 Artifacts、Bolt.new、Windsurf、Replit、Vercel……

AI Coding,為什麼成了最火的 AI 應用賽道

2024 年底,多位獨立開發者向極客公園表示,從大廠辭職、成為自己的老闆的自由是 Cursor 給的,現在 Cursor 最多可以幫助完成 50% 的程式碼。同時,隨著大模型從預訓練的 Scaling Law 切換到推理側後,AI 寫程式碼的能力還在明顯提升。

種種現象都在表明,在沒有迎來 AI 應用大爆發、仍在拿著錘子找釘子的 2024 年,「AI 幫助人類寫程式碼」是為數不多已經看到 PMF(產品市場匹配)的場景,甚至是最有可能實現 AGI、完全自動化的賽道。

更重要的是,當 AI 讓產出物可以跳過程式碼、直接變成軟體時,市場空間迎來了十倍、百倍的釋放。

2024 年 12 月 27 日,極客公園「今夜科技談」直播間邀請極客公園創始人 & 總裁張鵬,和 AIGCode 創始人 & CEO 宿文、豆包 MarsCode 產品負責人石揚,一起聊了聊當下最熱鬧的 AI Coding 賽道,以及中國創業者的機會。

以下是直播沉澱,經極客公園整理:

01

4 個月估值翻了 6.5 倍背後,

Cursor 的 PMF 超出預期

張鵬:最近 Cursor 以 26 億美元的估值融資 1 億美元,4 個月估值翻了 6.5 倍。除此以外,今年海外 AI Coding 賽道里也還有很多創業公司都以迅速膨脹的估值拿到了一輪又一輪融資。為什麼現在這個賽道非常熱?

石揚:現在整個大模型賽道特別像網際網路非常早期的狀態——大家在持續地尋找 PMF,無論是從 AI 原生應用的角度,還是在一個既有的 APP 裡把 AI 能力加進去,其實大家都是在用各種各樣的方式嘗試。

但程式碼很顯然是一個被證明有非常大潛力,且一定程度上已經實現 PMF(產品市場匹配)的場景。

最近 Cursor 比較火的一個主要原因是基礎模型有了很大的突破,比如Claude 3.5 Sonnet 出現之後,讓 Cursor 過去做的一些事情被放大了。當然,只有模型能力也不夠,Cursor 並不是短期突然冒出來的,而是在這個行業裡持續做了很多,它的成功是一個厚積薄發的過程。

張鵬:如果我們拆解一下 Cursor 的成功,哪些是模型比如 Claude3.5 出現之後,大模型帶來的助推?哪些可能是 Cursor 自己的積累?

石揚:我覺得 AI Coding 這個市場已經經歷了兩次 PMF。

第一次 PMF 大概在一年前,應用形態是 Copilot。那個時候 Copilot 主要的功能發生在程式碼補全,比如我寫一個 function(函式)時,AI 可以直接補全出來更好的程式碼。因為它的能力基於 ChatGPT 大模型,而大模型的底層邏輯 Transformer 演算法是預測下一個 token,由於更結構化、程式碼的預測難度相比語言更簡單一些,所以很快找到了 PMF。

Claude3.5 的出現讓我們看到另一個點——透過 Chat(聊天對話)的形式與 AI 對話,可以理解你的需求,直接生成更好的(程式碼),這是第二次 PMF,從單純的程式碼補全、跨檔案的補全,到 Chat 這個層面的變化。

但是隻有基礎模型也不行,在嚴肅的軟體開發的場景裡,能力只是底層,工具是對於很多能力的一層封裝,比如 Claude 3.5 也有 Artifacts 這種產品的型別。

所以這裡有三層事情:第一層是模型,第二層是工程,第三層是產品,Cursor 很好地結合了這三個部分。

當然也有很多討論,大家會問 Cursor 的護城河到底是什麼?它是否只做了膠水層的東西?Cursor 其實看到了很多使用者的真實需求,這是在 AI 這個時代做產品最難的地方——如何真正地滿足使用者需求。因為我們幻想了太多 AI 的能力,AI 可以成為這個、可以成為那個、可以實現 AGI,但實際上真的能夠回到使用者場景裡,很好地把 AI 的能力 fit in 到使用者需求裡,Cursor 做了很多。比如它做了很多小模型和亮點功能,像「Fast Apply」能夠迅速把生成的程式碼準確地插入到你特定的檔案裡,「在正確的時間、正確的位置生成正確的程式碼」。

宿文:我們之前有一次很有意思的討論說,Cursor 想做在大廠或者 AGI 巨頭的車輪前面「搶錢」的一個創業公司,並不是說這樣的創業模式不好,其實反而是很精準,很多創業公司就應該做這樣的事情。

在整個程式碼賽道上,不管從哪個點切入,抓住了使用者的痛點、把需求解決掉收到錢,這是像 Cursor 給市場帶來的很正向的反饋——你會看到它真正的、實打實的 ARR(年度經常性收入)的增長。Cursor 應該是用 9 個月的時間做到了 7000 萬美金的 ARR,還在繼續上漲。另外像 Bolt.new 用 3 個月的時間做到 1200 萬美金的 ARR,也是很興奮的進展。

張鵬:最近一年陸續聽到很多開發者說像 Cursor 這樣的工具已經能夠幫助他寫一半的程式碼了。從你們的視角,今天程式設計師的工作習慣正在發生哪些變化?我們來更具象地看看目前程式碼類AI產品、技術處於什麼樣的階段?

石揚:你不用它可能覺得也就那麼回事,但你一旦用完了之後就會發現很難再離開它。比如在你敲程式碼時,Copilot 大機率會補齊你的那一段比如 function(函式),這對程式設計師來講是一個非常高效的感受。就像自動駕駛一樣,以前我們開油車,大家都覺得比如「自動泊車」也沒有什麼意義,但是你現在開電車用過哪怕一次自動停車後,發現再回到油車感覺怪怪的,就希望有這個功能。

再舉一個 Chat 類程式碼應用的例子,我以前是一個開發者,你讓我去做一個「貪吃蛇」小遊戲,且把它做得有一定的可用性,也要花 1 到 2 天的時間,包括前端、後端調優,持續做很多 debug(排故障)的邏輯。但是現在,基本上只要靠對話,不管是用我們自己的 MarsCode,還是 Cursor、Windsurf 這樣的產品,基本上兩三個小時就能調出一個過去要兩三天才能實現的事。

分場景來看就是,程式碼補全更多是提升大廠打工人的愉悅感;但從 0 到 1 做出一個小程式、小遊戲的時候,你會很驚訝。「竟然這個東西也能把它做成」,用過之後會越來越會依賴它,不一定每次都準,但是它給你帶來的愉悅感會越來越強。因為現在 AI 實現從 0 到 1 的速度,遠比過去快得多得多,過去依靠的是比如拉一個模板,現在靠的是智慧生產力。

張鵬:海外這個賽道現在比較熱,這會給你們帶來哪些影響?

石揚:如果按照過去的方式來理解軟體,只把軟體當作一個工具,它依然是一個垂直賽道,即便 VS Code 或者 JetBrains 可能就十幾億美金,或者二十幾億美金的樣子。但 AI 的加成,讓這件事情從工具向軟體生產整個行業擴散,軟體賽道變得非常大,機會是非常多的。MarsCode 非常希望成為參與者,幫助開發者有機會生產更多的軟體。

豆包 MarsCode 即將上線的新客戶端 IDE 產品,除了提供完整的客戶端 IDE 體驗外,還可根據使用者上傳圖片和提示詞,生產完整的端到端程式碼

我覺得整個從業者,大家既興奮,但也是焦急的。我們看到了一個很好的曙光、很好的 PMF,有很多使用者的需求存在在這裡。

宿文:整個程式碼賽道,也有幾類產品。剛才石揚提到的 Copilot,或者像 Cursor、Windsurf 這樣的一些產品,整體上還是給專業程式設計師使用,服務全球已經存在的七八千萬程式設計師,大家已經都在 IDE(整合開發環境)裡工作,每天寫程式碼,現在透過對話的方式能夠生成一些質量更高的、片段式的程式碼,這部分需求目前解決得不錯。

另外一類程式碼類產品,是把程式碼消費的能力大規模地釋放出來,超過全球七八千萬、占人口 1% 的程式設計師的範疇,讓全球 10%、20% 甚至更多的人有使用程式碼的能力,當然這裡使用者要的不是程式碼,而是應用和軟體,這是我們 AIGCode 在做的事情,但是目前行業還沒有看到整個大規模的 PMF。

張鵬:宿文,對於你要實現的目標,AIGCode 目前處在什麼階段?下一步要核心印證的東西是什麼?是技術的可行性、還是對於需求的聚焦,最終把能力跟需求做到閉環?

宿文:國內大模型這個賽道經常會給人一種感覺是,「技術信仰主義」和「馬上要做商業化」這兩件事情是對立的,但是對於任何一個成功的公司而言,二者缺一不可。我們要思考,現在整個技術的邊界在哪,包括大模型的邊界和軟體工程的邊界,我們要如何做創新、來把技術的這兩個支柱融合在一起,最終透過產品,真正解決使用者的問題。

當然,因為使用者不同、場景不同,往往也決定了技術路線的不同,而不是有什麼樣的技術路線就一定要怎麼樣。我們是先定好對「直接生成軟體」的終局後,切入了最核心的點。一方面是自己做大模型,從而讓它的幻覺減少、以及像理科生一樣思維能力全面提升;另一方面是考慮到生成時代的軟體架構跟傳統的軟體業務架構會不一樣,所以從模型和軟體工程的角度來做產品。

未來幾周,我們的產品也會大規模釋放出來讓大家體驗和使用。

AutoCoder 上一個版本的產品演示|圖片來源:AIGCode

張鵬:對於 AIGCode 的目標而言,模型自研要解決什麼樣的問題?

宿文:大模型時代真正能給各個行業帶來劃時代影響力的,還是大模型這個發動機。

在模型上,我們發現程式碼生成的一些問題沒解決。對程式碼來說,最主要的還是準確率,對還是錯、能不能 run(執行)起來,但大模型的一大痛點是幻覺。在這一點上,網路結構上的最佳化能夠帶來很多收益,包括從最近 DeepSeek-V3 的釋出也能看到。同時,我們也會為了匹配更好、更絲滑的產品,在預訓練的過程加一些特殊的樣本、一些稀疏的樣本。

另外是長上下文,Cursor 也遇到了這樣的痛點,程式設計師在用的過程中,一開始很爽,基本寫到 2 個小時左右的時間點,就發現 Cursor 的效率明顯不如人。在這一點上,Cursor 最近也收購了專門做上下文的公司 Supermaven,來解決上下文和模型自身記憶容量(有限)的問題。

張鵬:做 AI Coding 產品需要做預訓練模型,在整個行業裡是一個相對共識嗎?

宿文:做預訓練模型不存在做一個垂直的模型:預訓練呈現出來的一定是 AGI 的能力;而做一個垂直的模型,基本全部的(通用)能力會喪失,這已經是很多實驗驗證的(結論)了。

而且做模型的廠商在預訓練環節最關鍵的一部分就是加 Coding 資料。當加入一些其他語料比如中文、英文甚至化學、生物的時候,模型的能力會出現丟失,唯獨增加程式碼能力後,所有專家的能力都會提升。我會感知到,程式碼本身是一個很高質量的語言,能夠激發出 AGI 的能力。

其實在程式設計賽道上,有兩家公司 Poolside 和 Magic 都自己做模型,因為他們發現很多模型用在寫程式碼上還不夠聰明,這兩家公司的估值大概是 30 億美金左右。

我們比較認同 Poolside 的路徑,它體現出:大模型不管怎麼做,生成的內容最終還是會呈現在一個二進位制軟體的世界裡,做「程式碼的生成」跟「做模型」這兩個事,一定程度上是等價的。在我看來,大家要把程式碼端到端寫完,跟做 AGI 是一樣的。只是具體解決什麼問題,提供什麼產品不同。

02

AI Coding,大家到底在卷什麼?

張鵬:我們借用一個框架來給現在比較熱門的AI程式碼類創業公司定個位。Cursor、Github Copilot、Claude3.5 Artifacts、Devin、Bolt.new、Windsurf、Replit、Vercel,包括你們的產品 AutoCoder 和 MarsCode,分別在哪個象限?各自在解決什麼問題?

為了幫助快速理解,該圖透過「解決某個人群(普通大眾/程式設計師)的什麼問題(輔助程式設計/自主程式設計)」來定位產品。每個產品的切入點和路線不同,有的從專業使用者出發解決專業程式設計師自動化問題,最後直接輸出產品,有一部分是幫助普通人直接輸出產品,但終極目標都是實現程式碼領域的 AGI,從 Copilot 往 Autopilot 不斷進化。

須注意:該象限圖只代表階段性觀察,各家產品/技術更新很快,不排除未來出現象限漂移;此外,該圖中的四個象限並不完全互斥,有的產品會同時涵蓋一二三象限。|製圖:極客公園

石揚:我更傾向把橫軸定義成「任務的複雜程度」,橫軸左邊是複雜任務、右邊是簡單任務。比如普通人想做一款「貪吃蛇」遊戲;但是程式設計師可能要實現一個像抖音這麼複雜的應用。

從這個角度看,Replit 最早只是一個 IDE,甚至不是 Copilot,但它和 VS Code 最近都加上了 agent 的邏輯,它大概也和 Bolt.new 在同一個象限,滿足簡單任務裡的端到端實現,與此同時也允許開發者(在複雜任務下)使用這個產品。

對於我們的產品 MarsCode 來講,目前還處在二三象限之間偏左一點的地方,希望服務程式設計師去完成複雜任務,讓 AI 幫助程式設計師提效,更好、更快地實現他想做的東西。MarsCode 未來的願景是在二象限的左上,也就是能做到複雜任務的 Autopilot。同時,我們自己的產品其實也面向了許多簡單場景,因為即使是程式設計師、每天做非常複雜的應用時,依然也會做簡單場景的應用。所以 MarsCode 還是希望在更多場景裡覆蓋不同人在不同場景裡的需求。

宿文:我覺得無論是服務於程式設計師還是服務於普通人,大家整體都在縱軸的維度往上做,也就是從 Copilot 到越來越 Autopilot 的過程。在橫軸上,不管是從目標使用者來區分、還是從任務複雜程度來區分,其實是大家選擇交付不一樣的市場價值,最終收斂到產品也不一樣。

AutoCoder 還是考慮怎麼做 Autopilot,把一些工具性或者冗雜性的工作變得足夠簡單。

Bolt.new 能夠生成比較高質量的前端程式碼,程式設計師能夠直接複製、使用,我們叫編譯,也提供一些 Web 端或者 APP 的端到端生成,但它目前的部署有點問題,是一個假部署。

Windsurf 基本上可以等價於 Cursor,產品體驗上可能會不同。Vercel 目前的形態跟 Bolt 會很像。

最後可能留一個避免被徹底打臉的口子,其實大家迭代產品的進度是很快的,可能它未來會完全會變掉,象限之間都有可能出現飄移,這個圖只代表今天的、甚至是一部分的樣子。

張鵬:這些產品裡,哪些帶給你們最多的啟發,你最喜歡哪個?

宿文:今天看,各個象限的產品都還不太成熟。就現在來看,我最喜歡 Cursor,它在程式設計師這個存量市場的需求上,給大家解決得很爽。至於護城河,我覺得它會去考慮構建的。

石揚:我個人比較喜歡兩個產品:第一個是 Cursor,第二個是 Bolt,我覺得它代表了目前產品的兩個流派。

為什麼?Cursor 自己講它是「the first AI IDE」,本質上它是基於 IDE 向 AGI 或者說 Autopilot 進發的,它面向的是專業的開發者。(但)這個群體其實已經存在在 VS Code(微軟開發的一款跨平臺原始碼編輯器)很長時間了,VS Code 有非常豐富的工具鏈,所以 Cursor 要基於已經存在的使用者場景做增量、試圖在這個場景裡透過加入更多的 AI,讓使用者從微軟的 VS Code 向 Cursor 提供的 Autopilot 遷移。

Cursor 不僅是加了很多 AI 的能力,而且花了大量功夫讓程式設計師的程式設計體驗變好,比如說它的「Fast Apply」,它的「多點編輯」,包括它的「Tab」等等,乍一看覺得沒什麼,但實際上就是這些細節讓它收穫了程式設計師的喜歡和共鳴,所以Cursor 是從 IDE 向 Auto pilot 進發的流派。

另一個是 Bolt.new,我覺得 Bolt 是從大模型向 Autopilot 去進發,也就是說 Bolt 構建產品的邏輯是,我有了一個模型,模型能夠生成很多程式碼,雖然它今天不完美。在這種情況下,Bolt 找到了一個場景——前端程式碼的生成的能力。Bolt 這個產品給你的感受是不在意「編輯」,像 Cursor 基於 VS Code 向 Autopilot 演進的過程中是重編輯的,程式設計師寫程式碼就跟你寫字一樣其實有一個非常大的編輯區,但是 Bolt 重的是聊天,更重視「你告訴我你需要什麼」,然後它幫你 generate(生成)。

未來我們會從關注程式碼本身變成更加關注軟體,產出物直接變成了軟體,Bolt 讓我看到了未來可以實現 Autopilot 的一種產品形態,儘管它還非常早期。

張鵬:在程式碼領域,Copilot 和 Agent(或者叫 Autopilot)這兩條線,這兩年經歷了怎樣的發展?

宿文:Copilot 和 Autopilot 兩者的技術路徑、場景、商業化等等不太一樣,但整體上大家沿著南坡北坡爬(各自的)珠峰。

目前看起來,Copilot 在路徑發展上,整個 PMF 是超出預期的,今天對整個程式碼領域、對程式設計師世界的改造已經非常大了。

但是另外一邊,Autopilot——大家提出需求後能夠生成一個端到端(應用)。以前這樣的需求,是被一些低程式碼工具在解決,但是限於低程式碼本身的技術路線,沒有把這個事情給完成。

現在,透過大模型實現端到端生成時,能夠解決的問題是,完成一個 Web 端的端到端生成,像 Bolt.new 或者 Vercel v0.dev,或者還有一些偏 ToC 或者娛樂性的 Websim.ai、CreateAny.ai 都是,包括 Claude 的 Artifacts 主要也是圍繞 Web 前端去解決問題。但大家生成的質量或者交付的最終形態上有比較大差別。

從整個 Autopilot 來看,我們團隊想象的是,一個完整的軟體應該從資料庫開始,從後端到前端是一套完整的軟體工程。目前還沒有看到一個類似的產品或者一個團隊做出這樣的事。Magic 和 Poolside AI 可能想做,比較期待他們最終會交付一個什麼樣的產品出來。

03

ToC 基因的位元組,

為什麼要做程式碼軟體

張鵬:剛才看了海外 AI Coding 領域創業公司的熱鬧和繁榮,國內這個領域的進展怎麼樣?

宿文:國內起步倒不晚,基本上所有的大廠全部都進來開始做,創業公司也有,我們是差不多一年前做的,2024 年初。

在我們看來,做大模型和程式碼生成,在本土競爭的空間是很小的,最終還是要面對全球化充分競爭,因為程式設計師都有能力去使用 Cursor、有能力去使用 Github Copilot,好產品大家是見過的。

過去一年看下來,國內的產品還不那麼彪悍,2025 年可能會有一些。

石揚:在移動網際網路時代,社交、電商、娛樂可能都會有地域性的產品,但開發者工具在過去是很少分地域的,一直是一個贏家通吃、強者恆強的市場,比如剛才提到的微軟的 VS Code。

現在很多人會說,其實沒有人能戰勝 VS Code。我也認為最大的大魔王一定是微軟,因為短期的競爭看產品和模型,長期的競爭是看成本和渠道。

微軟 CEO 納德拉|圖片來源:視覺中國

但在產品上,大家都各有自己的看法,包括要不要做模型等等存在大量非共識。從我們的視角來看,短期來看,模型應該還是中國有中國的,海外有海外的。第二,上一代程式碼產品是用作工具的,如果 AI 的加入仍舊讓這個東西是一個工具,我覺得不用捲了,VS Code 已經足夠好,生態已經足夠完善。但是今天 AI 的變數帶來的不只是工具。

張鵬:AI 在這裡會帶來什麼影響?

石揚:當 AI 在一定程度上幫助人直接做出不同型別的應用時,它帶來了新的機會。我反而認為在中國是一個非常獨特的市場,因為中國市場的需求足夠不同。海外的程式設計師做 Facebook、做 API-Driven 的 ToB 軟體;而中國程式設計師做抖音,做更加人工定製驅動的 ToB 業務。

所以無論是從底層預訓練模型給它的語料、資料,還是在做工具、產品時的取捨上,都會不同。

舉個最簡單的例子,海外沒有小程式,你跟 Bolt 或者 Vercel 說:「你幫我生成一個小程式」,它都不知道小程式是什麼東西,也就不知道怎麼幫你做或者幫你呼叫;再比如在中國做 ToB 要大量的定製,這個時候你跟海外的產品說:「我要基於中國的某些軟體去做定製」,它也根本沒有這個經驗。

所以從我們的視角看,第一,AI 時代的軟體生成,是有 Localization(本地化)需求的。第二,在全球,它是一個重新洗牌的機會。這也是為什麼至少短期看,Cursor、Windsurf、Bolt,它們跑得這麼好,當變數發生的時候,巨頭的反應永遠是相對慢的。但也要注意,當增長放緩的時候,你才能體會到巨頭的可怕。

宿文:程式碼整個市場空間還是很大,大家使用者頻譜的切割不一樣,不管是大公司還是初創公司,只能切其中的一段去服務,還是要看到底切哪一段。

石揚:程式碼生成,其實只是整個軟體鏈條裡的一部分。生產一個軟體,至少要經歷需求、設計、寫程式碼、上線、維護全週期反覆連續的迭代。

AI 這個新的生產力會讓過去不敢想,或者做不到的事情在一定程度上成為可能,全鏈條裡面有太多太多的細分場景可以被提升,但現在看起來每一個方向是非常早期的狀態。

便像 AI 寫程式碼目前好像跑得稍微快一些,但我覺得都不一定能類比網際網路的 1998 年時刻,比如大家在投資雅虎的時候,很難想象後面還有這麼多偉大的公司,Facebook、Google,包括阿里、騰訊、位元組這些公司,所以很難精確地判斷它會是什麼樣子,但我非常樂觀地期待,會有很多不一樣的事情誕生。

張鵬:評論區有人問,位元組做這件事的 Vision 是什麼?現在已經有比較清晰的 Vision 了嗎,還是一種 Bottom-Up 的探索?

石揚:我覺得對於這件事情最大的 Vision,來自於我們看到 AI 釋放了新的生產力,能夠幫助到開發者去生成更多更好的軟體,能夠讓效率極大的提升。回到剛才那張圖,我們希望到那張圖的左上角,因為簡單場景也會被複雜場景 Cover(包括進去)。

張鵬:今天我們在聊 AI Coding,SaaS 肯定是它衍生相關的領域,蝴蝶效應最快傳達的可能就是這個領域。評論區也有觀眾問,未來 SaaS 還存在嗎?大家會怎麼看?

宿文:我覺得 SaaS 會長期存在。

從 SaaS 客戶的角度看,對 SaaS 軟體除了有合規、管理等相對標準化的工作流需求之外,還有各種個性化、長尾、非標,甚至是成長中的需求。這部分需求怎麼滿足?過去,SaaS 軟體供給方其實趕不上需求方的成長速度,供給的成本、速度、質量是相對滯後的。

現在,AI Coding 能把這部分需求空間擠掉,或者說 AI Coding 本身會滿足、釋放大量的個性化場景:非標、長尾的需求,甚至僅僅是一個人單次的使用需求,如果這個成本降到用一次手機流量的成本。從這個角度看,通用應用、SaaS 其實是支撐 AI Coding 滿足個性化需求的生態。我反而覺得這兩者會相互驅動、越來越繁榮。

張鵬:某種程度上,SaaS 的特性決定了,如果做大量的個性化需求,就沒法 SaaS(標準化軟體服務)了,但個性化的需求又是普遍存在,所以反而可能 AI Coding 彌補的頻譜是在 SaaS 的延展側,有非常大的空間。你剛才講了一個極端的例子,「次拋型軟體」。

宿文:「用後即焚」。

張鵬:石揚怎麼看 SaaS 領域未來的變化?

石揚:從我的視角,AI Coding 和 SaaS 並不是一個互斥、取代的關係。

張鵬:甚至是讓 SaaS 的降本增效更明顯,個性化交付變得更好。

石揚:對。我以前也是做 SaaS 出身的,我覺得 SaaS 也要分中美。我想問一句,SaaS 真的在中國存在過嗎?

如果 SaaS 的定義是企業軟體,那還有一類軟體叫做個人軟體或 ToC 軟體。我覺得 ToC 和 ToB 最大的差異在於:ToC 產品只要一兩個 Killer feature(殺手級功能),就可以滿足 80% 到 90% 的使用者需求。所以對於 ToC 應用,不存在長尾需求,無非是特別特別小的需求,其實也沒有太多人用;如果它的長尾足夠大,就會生產出另外一個應用來。

ToB 就不一樣了,它可能是 80% 的功能滿足了可能最多一半的使用者,剩下一半的使用者幾乎都是有個性化需求的。因為 ToC 講的是人性,人性都差不多;但是 ToB 講的是管理,管理是一個逆人性的事情,必然就會有非常非常多在這個公司裡產生的合理的訴求,因為企業的管理方式、流程的不同。

在美國的生態環境下,滿足這些需求的方式來自於約定,「我知道這個功能不能完全滿足,但是我們可以約定:這個功能你可能再做一些努力,我也再做一些取捨,我們就用這樣一個標準化的應用完成工作流」。

在中國是另外一番場景,SaaS 是一個標準化軟體的方式,但是中國從來不 buy-in 標準化軟體,「我確實希望這個軟體長得更像我要的那個東西」。

所以 AI Coding 對於中國的 ToB 市場,反而是利好,不是 AI Coding 來了 SaaS 消失了,而是 AI 讓 SaaS 更能實現滿足中國使用者需求的企業軟體。其實在美國也是,不是個性化需求不存在,只是實現成本太高,所以妥協。

張鵬:個性化需求原先需要 SaaS 公司的定製化團隊提供額外服務,現在,用一個軟體就解決了個性化需求。原來 SaaS 是「Software as a Service,軟體即服務」,現在 AI 讓 SaaS 變成「Service as a Software,服務即軟體」。

我反而覺得,如果大規模個性化定製可以這麼低成本地實現,需求也會被進一步激發,反而因為 AI 的到來,中國未來會真的有 SaaS。

04

AI Coding 的未來

張鵬:最近兩年大家被 AI 集中轟炸,短短兩年之內很多人就失望過好幾輪了。比如大家還記得 Jasper 嗎?Jasper 當年出現時,一度讓人無比興奮,結果它的能力其實沒有逃離大模型的主射程。隨著模型比如 o1、o3 還在不斷往前走,模型通用能力以及程式碼生成能力的繼續成長,AI Coding 應用未來會被大模型覆蓋嗎?

宿文:我們覺得,如果真正大家想象中的 AGI 的狀態能到來時,其實和程式碼實現平權化基本上是同一個時間點。

但是今天來看,明顯沒到達。從技術上看,o1 也沒有把程式碼生成的事情解決得很完美,o3 也還是在一個小樣本的空間內,在它見過的題目裡面可以做得很好,但是怎麼去做泛化的推理,以目前的技術路線可能還是很難實現,或者實現成本巨高無比。

從初創公司的角度看,我們覺得還有其他路徑實現。目前整個 2024 年,其實在底層模型上的進展不多、亮點不多,DeepSeek V2 可能是一個(里程碑),DeepSeek V3 我們覺得還有比較大的完善空間。

從目前業內的實踐來看,這中間的安全空間還蠻大,或者說 AI Coding 應用和大模型的進化這兩個東西是互相成就的,不用擔心進入大模型的射程,這還比較遙遠。

舉個最簡單的例子,o1 或者 o3 能夠在一些榜單上超過奧賽金牌,但是我們真正拿它代替一個最普通的軟體外包公司程式設計師解決更泛化的任務時,會發現好像也沒法替代。

石揚:我們是否焦慮被模型吞掉這件事情,從我個人的角度,我非常希望模型能夠吞掉。因為我更期待 AGI 發生,它可以幫我們做更多事情,實現了跨越式的發展。

第二,大模型和,AI Coding 或者 IDE 之間的關係,我覺得更像是大腦和工具的關係。大模型是大腦,它的智慧會不斷地提升,但它依然需要工具幫它去體現它的智慧。

比如可能 AI 在很多場景裡已經可以達到奧賽金牌的水平了,但是有幾個獲得奧賽金牌的人做程式設計師呢?不是超過了奧賽金牌水平你就是一個程式設計師、一個工程師,因為不同場景裡對工程師有一些特有的要求。所以如何在特定場景裡把智慧釋放出來,這個是我們自己的使命,是要做的事情。

張鵬:同意,模型要是真的實現 AGI,有無限供給的生產力了,人類都自由了,這是挺好的一件事。但科技從來不是一個大進度條的跳躍,都是一個畫素點一個畫素點的填充,比如今天的 Copilot。

今天要做好一個 AI Coding 的 Copilot,向 Autopilot 進化的過程中,技術成長的關鍵點會在哪裡?

石揚:整個行業在預訓練上做的事情會越來越收斂,當然最領先的幾家一定會所謂的「獨家秘方」或者大招,但是共識會越來越趨同。

當把它收斂到一個 AI Coding 產品時,還有很多工作。

比如訓練模型,是要給它很多演算法題比如 IMO 的這些題,讓它能夠很聰明地解出來。但是實際工作裡,不是解演算法題,而是要理解需求,比如生成一個小程式、一個前後端的應用,它到底需要什麼樣的技術棧、框架、需要什麼樣的 UI 前端渲染……所有這些東西。

牽引目標的不同,訓練方向也不同,你需要大量的比如 Post-training(後訓練)、RL(強化學習)、SFT(微調),才能夠真正讓模型加工具,更像一個程式設計師在工作。

張鵬:未來要解決無限供給的程式設計師,或者是無限提升的程式設計生產力,它在產業裡最終可能會怎麼實現?

宿文:今天還很早期。拉遠看,商業的形態,或者說分發的形態會變成什麼樣?我覺得要看在程式碼生成裡我們核心的三個指標的完成度。

一是效率,以前以小時、以周、以月為單位的程式設計師工作變成秒級,甚至毫秒級,那就完成了效率的使命。

第二,質量,軟體工程是端到端執行的,哪怕有 bug(故障)也一樣能執行起來,但 AI 也能滿足質量的需求,或者說讓更好的工具實現普惠。

最後是成本,當 AI 推理成本,變成電的成本,變成基礎設施的時候,就會有新的形態出來,比如會出現我們想象中的端到端的形態。不用下那麼多 APP、但常用的就幾個了,個性化需求最後可能會收斂到一個應用,只有一個入口,這一個入口底下有大量的應用、場景、資料的供給,滿足我所有「閱後即焚」或者陪伴我一段時間的需求。

張鵬:兩位剛好在不同的角度:大廠和創業公司,來做 AI Coding 這件事,心態上會有什麼不同?

宿文:我覺得無論大廠或者創業公司、共識或者非共識,這個事大家賺錢的機率是差不多的,都是小機率事件。

創業之後會聚焦到一個專案上,會考慮很多事情,從軟體工程和目前模型的邊界等等,因為技術世界,菜是原罪,你要接受淘汰。但同時,你不是為了淘汰而來的,你要拼盡全力,看清楚技術的卡點在哪、要解決的工程問題在哪、商業化問題等等,每一個方面都要考慮。

石揚:我覺得位元組還是一個非常創業文化的公司,尤其是在這種創新業務上,我相信不管是我剛才講的想法,還是我每天講的,可能 100% 都是錯的。在這個環境中,允許不斷試錯,從錯誤裡學到更多的東西,在這一點上其實跟我以前創業沒有特別大的區別。

當然比如創業要考慮你的錢是哪裡來的,在大廠裡面資源可能相對充足。

張鵬:MarsCode 今天在探索複雜任務下的程式設計自動化時,會遇到哪些挑戰?

石揚:每天面臨著無數的挑戰,首先 AI 和大模型這件事情本身就是非常難的。

第二,如果有足夠多的錢就能贏,我相信世界上就不再有創業公司了,所有的巨頭都是從創業公司生長起來的,最難的還是認知。認知是平等的,每一個人每天只有 24 小時,只能獲得或者處理這麼多資訊。如何獲得認知對我們來說也是一個極端的挑戰。

其次是使用者,如果沒有足夠的使用者驗證想法,我覺得它是很難的。如何洞察使用者的需求,並且能夠基於現在模型的能力,滿足使用者需求,這也非常考驗產品功力。未來可能 GPT 20 出來之後,AGI 發生了,生成程式碼是非常容易的一件事情,但基於今天的模型現狀滿足當下需求,也是一個挑戰。

最後是速度,試錯的速度。我覺得我們現在的狀態還是不夠快,不如很多創業公司如此之敏捷。如何能夠加快在試錯的次數、試錯的效率,以及從錯誤中學習的能力,也是每天需要思考的問題。

張鵬:預測在 2025 年 AI Coding 領域裡面還會有什麼變化?

石揚:從行業上看,我期待更好的模型能力能夠釋放出來,我們能夠把這些更好的模型能力,轉化成交付給使用者手裡的生產力。最近行業的進展,無論從模型的推理能力、效能、速度,包括 OpenAI o3 雖然只是預告片,但都能看到很多的細節,非常令人期待。

第二,也期待有更多人參與到程式碼生成的行業裡,因為只有更多優秀的人加入到這個行業,才會迸發出更多的想法。大家在競爭中共同進步,對手足夠強大,你才找到了更多的真正使用者,以及能夠打動使用者的需求。

張鵬:2025 年,對 MarsCode 有什麼期待?

石揚:整個去年 MarsCode 已經發了一款程式設計助手的外掛,同時有云版本的 IDE 版本。2025 年估計每個季度都會有一些新的產品能力、產品形態釋放出來,也非常期待 MarsCode 能夠滿足更多使用者的需求。目前可以看到大量使用者的需求是未被滿足的,整個行業無論是從資本,做這件事情的團隊以及使用者,對這件事情的期待都非常高。

過去一年 MarsCode 大概有 100 萬使用者,也特別期待老使用者繼續喜歡我們,更多新使用者能夠看到我們的進步,用我們的新產品。做產品最大的快樂其實也來自於做出一個有價值的產品,被更多人用到的產品。

張鵬:宿文,你認為 2025 年這個行業有可能出現什麼樣新的亮點和變化?

宿文:目前模型和程式碼應用的發展可能稍微有點非同步,期待明年有比較大的進展,不管是模型還是 Coding,我們更願意把這兩件事等價起來,儘管距離手機時代的 iPhone 時刻還很遙遠。

近期看到特別有意思的一段《悟空傳》裡面的一句話,「人在最有價值的時刻不是功成名就的時候」,我覺得大模型、AI Coding 最有價值的時刻,也不是到最後我們把 AI Coding 變成平權化的那個節點,而是在今天的條件下,怎麼做決策。當然也會面臨巨大的不確定性和競爭,但反而會是很有價值的一年。

張鵬:AutoCoder 接下來會有哪些階段性的進展和值得期待的變化?

宿文:一個是準確率,對於大家表達的意圖和需求,在軟體裡可以準確地、結構化地被模型識別。這一點上,整個軟體架構上會有很多提升準確率的實現方式。

另外是靈活性,在程式碼生成時,程式設計師從每一個方程、每一個函式或者其他的形式開始寫,這裡面是有巨大的靈活性的,如何完善靈活的使用場景,能夠讓產品經理也直接用,是需要完善的。

最後是完善度,我們會首次在 AutoCoder 產品裡覆蓋從資料庫、到後端和前端的一體化生成,大家使用的體驗會更流暢、更深度。我們更願意做一個嚴肅的產品,讓大家的感知和體驗都更好。

AI 的終極目標是讓普通人也能享受程式設計的樂趣,讓不會程式碼的人也能透過 AI 來實現需求,所以這應該是大家的終極目標,只是根據他們今天的起點和麵對的使用者人群以及場景的不同,選擇了不同的切入點。

有些產品是從專業的使用者出發解決專業程式設計師的程式設計和協作問題,解決自動化的問題,最後能夠直接輸出產品,有一部分是直接面對普通使用者,輔助他們完成專業的程式設計,甚至直接輸出產品。