Good Luck To You!

手机扫一扫

王小川的百川智慧釋出全鏈路領域增強金融大模型,準確率超過GPT-4o

鳳凰科技 2024-12-24 01:35:35 2

(圖片來源:鈦媒體AGI編輯林志佳拍攝)

(圖片來源:鈦媒體AGI編輯林志佳拍攝)

“大模型六虎”加速內卷,百川智慧公佈金融垂直領域模型。

12月23日訊息,鈦媒體AGI獲悉,王小川創立的通用 AI 公司百川智慧今天釋出全鏈路領域增強大模型Baichuan4-Finance。在高質量金融資料的基礎上,透過行業首創自約束訓練方案,Baichuan4-Finance實現金融能力和通用能力,極大提高金融場景整體可用性。其金融專業能力和場景應用能力大幅領先GPT-4o。

百川智慧創立於2023年4月10日,由搜狗公司創始人、前CEO王小川創立,旨在打造中國版的OpenAI,構建中國最好的大模型底座,幫助大眾輕鬆、普惠地獲取世界知識和專業服務,並在醫療與行業領域應用落地。截至目前,百川智慧已相繼推出16款大模型,涵蓋開源、閉源、學術科研、國產算力等多個維度。

今年10月31日,百川智慧宣佈推出包括Baichuan4-Turbo、Baichuan4-Air兩款模型在內的一站式大模型商業化解決方案,即1+3產品矩陣(全鏈路優質通用訓練資料,Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領域增強工具鏈)。

如今,百川智慧向金融領域提供全新的大模型產品。

具體來說,中國人民大學財政金融學院12月17日釋出的金融評測體系FLAME以及國內主流開源金融評測基準FinancelQ上,Baichuan4-Finance均登上榜首。其中,FLAME-Cer評測結果顯示,Baichuan4-Finance在銀行、保險、基金、證券等多個資格認證領域的準確率均突破了95%,整體準確率93.62%,大幅領先金融領域公認的綜合實力最強的通用模型之一GPT-4o、國內首個開源中文金融大模型XuanYuan3-70B-Chat,超出GPT-4o近20%。

同時,百川智慧打造了一套全鏈路領域增強方案,該方案覆蓋了高質量資料集構建、模型預訓練、微調、強化學習等從模型研發到場景應用的全流程。同時,Baichuan4-Finance還在領域自約束訓練過程中引入了更高精的通用資料,與高質量金融資料一起進行混合訓練,最終實現了模型通用能力不下降,金融能力穩定增長的效果。此外,百川智慧在後訓練環節也做了大量增強工作,如:透過合成資料、指令資料對模型進行有監督的微調;在強化學習策略中,針對數學計算等金融領域特別關注的場景進行樣本增強等,進一步提升了模型效能。

同時,百川智慧打造了一套全鏈路領域增強方案,該方案覆蓋了高質量資料集構建、模型預訓練、微調、強化學習等從模型研發到場景應用的全流程。同時,Baichuan4-Finance還在領域自約束訓練過程中引入了更高精的通用資料,與高質量金融資料一起進行混合訓練,最終實現了模型通用能力不下降,金融能力穩定增長的效果。此外,百川智慧在後訓練環節也做了大量增強工作,如:透過合成資料、指令資料對模型進行有監督的微調;在強化學習策略中,針對數學計算等金融領域特別關注的場景進行樣本增強等,進一步提升了模型效能。

商業化層面,目前,百川智慧已經服務了數千家客戶,包括北電數智、完美世界遊戲、愛奇藝、360集團、生學教育、愛學堂等各行業的領軍企業,並且與信雅達、用友、軟通動力、新致軟體、達觀資料、華勝天成等多家行業生態夥伴,以及華為、中科曙光等硬體廠商,中國移動、中國電信、中國聯通等運營商達成合作,攜手構建百川大模型生態。

用友表示,Baichuan4-Finance憑藉其海量的金融專業知識儲備,在財稅知識問答場景中,準確率較Baichuan4-Turbo提升了20%,較GPT-4o提升了10%,表現尤為亮眼;軟通動力表示,自部署Baichuan4-Finance以來,其客戶滿意度提升了20%。

事實上,百川智慧已經轉向行業模型領域。百川智慧創始人、CEO王小川早前表示,AGI 正在產生巨大的突破,但目前百川沒有達到世界級的水平,只是有一定成績,對自己來講有 60 分吧。主要今天在現實和理解中得找到自己的一條道路,百川認為自己已經打明牌了,有實踐的路徑。

“定義什麼是 AGI,其實有很多行業討論,大家不斷在上面加碼。之前我們討論‘機器怎麼才算有智慧?’以前是圖靈測試,對話者分辨不出來是人還是機器,這就算智慧了。到了今天,機器還要會解數學題,還要有主動學習的能力。我理解 AGI 是做到“像人一樣”,像一個數字員工,能夠在多個職業裡產生工作成果。之前和一個技術大佬交流,他質疑當下的大模型,他說大模型七位數乘法都做不好。我反問‘你會嗎?你拿著科技公司的股份,你也不會七位數的乘法,你為什麼要求 AGI 會?’這是個審美問題,我們以前總是把 AGI 當成一個工具,它是超級計算機,能精確地做計算,或者跑程式跑得很快。但 AGI 本身,我覺得就像人一樣,如果審美沒有建立好,你怎麼去評價它呢。AGI 正在產生巨大的突破,它的文章已經寫得像最頂尖的文科生了,還可以寫詩,隨著 OpenAI o1 的推出,AI 有了更好的邏輯推理能力,文理雙修。但它並不是上帝,它像一個極其聰明的人,但它現在真的知道宇宙規律嗎?”王小川表示,AGI 現在還在飛速發展中。往後還有新的突破,發展速度並沒有變慢。大家都過高期待這兩年的速度,也許三五年後,就會非常不一樣。而今天我們從網際網路時代走入到了 AI 時代,他感覺很幸運,沒有錯過每一個時代。

對於 AI 搜尋,王小川表示,雖然這能走出百度射程,甚至能夠顛覆百度,但它依然在位元組產品的射程裡。“從競爭角度,在大廠的 DAU(日活躍使用者)範疇內,我們還是處於弱勢地位,在很多地方也搞不過小公司,他們對於需求敏感度的把握,會把腰部公司撕的粉碎,他們有很強的競爭力。反過來,醫療領域大家都認為是垂類,小公司不一定做的動,雖然上一代已經投了 1000 億進去,投資人很多都失去信心了,但投資還在持續加大。”

王小川強調,醫療絕不只是垂直方向,它不僅與 AGI 是等價的,還代表著生命科學的未來想象。

“我們從今天的智慧時代走向生命時代,可能會越走越廣闊,醫療是當下特別好的,獨有的一個卡位,但我相信在三年、五年後,大家會看到它不是個垂直方向,它可能代表更廣闊的未來。”王小川稱。

(作者|林志佳,編輯|胡潤峰)