Good Luck To You!

手机扫一扫

高校,一覺醒來成了智算採購大戶

鳳凰科技 2024-11-28 01:32:00 1

過去兩年,以大模型為代表的新一代人工智慧浪潮,在全球的發展中展現出蓬勃活力和巨大潛力。AI已不僅僅是技術進步的象徵,更已成為國家戰略中的核心要素。

“如果說今天有什麼事是我們一定要做的,那就是AI For Science(AI4S)。難以想象今天還有什麼事情比它更重要,今年諾貝爾獎的頒佈便是最好證明。”

11月下旬,在深圳舉辦的2024年IDEA大會上,香港科技大學校董會主席沈向洋表示,當前做人工智慧研究,一方面要全力推動大模型技術的落地,另一方面也要關注它在科學研究中的應用。

第二天,在前往香港與黃仁勳進行一場對談的過程中,沈向洋又再次提到了AI for Science,並提及香港科技大學已圍繞這一熱門方向,投入大量的計算基礎設施和GPU資源。

黃仁勳則回應稱,高校目前確實面臨著一個嚴峻的結構性難題,即計算資源分散,反而導致一些研究算力獲取難。這也是為什麼,之前很多研究員選擇先前往英偉達、谷歌、微軟等大公司進行研究,再返回大學,甚至許多教授,會選擇在從事教學工作的同時,兼顧研究工作的原因。

黃仁勳因此建議“大學應該成為基礎設施建設的引領者,透過集中資源來推動全校的研究發展”。

實際上,業界觀察,最近兩年隨著大模型的到來,尤其近期諾貝爾獎的釋出,讓高校對AI for Science、大模型和智算的投入熱情進一步高漲。

01

諾貝爾獎後,高校熱情高漲

最近,多位業界人士觀察,圍繞AI for Science,高校對大模型、算力等方面的需求正在愈發活躍。

大模型方面,最近兩個月,教育依然是公開招投標市場上,出單數排名前列的幾大行業之一。“現在不光是211、985,還有大量地方級的一本、二本學校也都在主動聯絡我們,探討合作。”一位大模型行業人士告訴,“高校都在努力擁抱大模型。”

算力方面,近期市場上,更是頻繁湧現大單,多所大學都在釋出千萬元級別甚至上億元的算力採購需求。

AI for Science並不是一個新概念,早在2018年,中科院院士鄂維南就在全球首次提出“AI for Science(科學智慧)”概念。AlphaFold在蛋白質結構預測方面的重大突破,也持續推動著這一概念深入大眾視野。而今年10月,諾貝爾物理學獎、化學獎紛紛頒給人工智慧相關專家,則讓這一概念走向更大舞臺,再一次成為了熱門話題。

“大家最興奮的是,原來AI for Science要由各種不同的模型去做,但現在搞蛋白質的、搞數學的......都可以‘揉’到大模型的方式中來,核心架構甚至全都是transformer。”百度傑出系統架構師王雁鵬告訴數智前線。

這讓一向作為科研主陣地的高校們看到了新的確定性方向,都在集中火力,推進AI for Science的發展。

更頻繁的學術交流和經驗探討是一方面。近期,全國各地湧現出了多場AI for Science相關論壇。其中,有不少是由高校主動發起。比如,10月底的2024中國計算機大會上,復旦大學發起和組織了“第一屆科學智慧(AI for Science)論壇——探索科學智慧的邊界”。11月初,北京大學計算機學院,也和北京科學智慧研究院一起,主辦了“2024科學智慧峰會”……

一些高校也在成立專門的機構或組織,來推進AI for Science發展。比如香港城市大學,就在10月21日宣佈成立了香港人工智慧與科學研究院,並與多名學術和業界夥伴簽署合作備忘錄,共同推進人工智慧(AI)領域的前沿科研。

人才方面的培養也在加速。數智前線注意到,10月底至今,浙江大學已經與中國人工智慧學會(CAAI)、國家開放大學、CAAI 教育工作委員會等一起,連續製作六期“諾獎後談AI”的人工智慧通識課程系列直播公開課,推動大學生人工智慧素養培養。

除此之外,大模型時代下的AI for Science,正在對高校的算力問題提出新的要求。

業界觀察,高校傳統的算力建設方式,往往是不同院系甚至不同研究小組,自行採購和管理各自的計算資源,從而導致一個學校記憶體在多個小型計算叢集,容易出現算力資源分散管理、忙閒不均、共享不暢等問題,無法滿足大型模型研發所需的高速通訊要求,拖慢科研成果產出效率。

“為適應AI4S的需求,模型研發必須在算力、演算法和模型框架等多個方面進行協同最佳化和建設,傳統的分散建設方式已不再適用。”去年10月,在一場AI大會上,復旦大學人工智慧創新與產業研究院研究員程遠曾表示。

為此,早在去年6月,復旦大學就和阿里雲、中國電信合作打造上線了號稱是當時“中國高校規模最大的雲上科研智慧計算平臺CFFF”。而該平臺由面向多學科融合創新的AI for Science計算叢集“切問1號”和麵向計算科學高精尖研究的專用高效能運算叢集“近思1號”兩部分組成。

無獨有偶,更多高校也都在加速算力基礎設施的投入和建設。今年1月,浙江大學與中國移動簽署戰略合作協議,並宣佈共同打造“全國首個校企合營模式算力中心——中國移動-浙江大學啟真算力中心”。4月,香港科技大學(廣州)智算中心也正式啟用……

今年10月,諾貝爾獎的釋出,則帶來了進一步的需求刺激。“最近,高校的熱情普遍很高,預算也在變多。”王雁鵬告訴數智前線,他們已經看到好幾個高校,都拿到幾億元的資金,要加大智算基礎設施的投入。

像上海交通大學,已轉變傳統科研模式,期望科學與AI更緊密的結合。他們與百度智慧雲合作建成了自己的AI for Science科學資料開源開放平臺,支撐白玉蘭科學大模型的訓練。依託AI for Science平臺,上海交大已在Nature Computational Science封面,發表了AI+城市的科學成果。

02

大模型時代,產學研合作有了新內涵

高校紛紛加碼AI for Science的同時,產學研的結合正變得愈加密切。

中國科學院院士鄂維南曾不止一次在演講中表示,隨著AI for Science的發展,科學研究將告別原來一個課題組完成所有科研任務相關事務的“作坊模式”,轉為類似“安卓模式”的平臺科研,打破學科邊界。

“在平臺科研的基礎上,針對具體的應用場景,透過垂直整合方式組織科學團隊、實驗團隊、產業界專家聯合進行攻關,將極大提升科研的效率以及產業發展。”鄂維南說。

一位來自國內大模型和算力服務企業的資深人士也告訴數智前線,隨著大模型的到來和持續落地,校企合作目前已成為普遍趨勢。“原來很多東西都是我們要主動去找高校,但最近兩年,高校主動找來的比較多。”該人士表示。

合作也在更加深化。“原來可能只是和高校本身籤一個戰略協議,在IaaS層合作,或者大家去找到一個點,做一些傳統應用的合作。”上述人士介紹,但最近兩年,高校裡面的很多二級學院,也都在紛紛找他們進行合作。而這些二級學院,想要合作的業務方向也都不一樣,往往覆蓋了交通、藥品、能源製造等不同領域,畢竟他們手中握有一些專業資料,在大模型時代有必要條件。

不過,AI雖然幫助突破了原來的科研瓶頸,但對科研團隊的“硬+軟”實力也提出了更高要求,校企合作更有利於實現優勢互補。

比如在隧道與地下施工領域,山東大學與浪潮雲合作,透過地質統計學、流體力學、電腦科學及資訊科學等多個學科聯合,搭建了岩土工程領域大模型與災害預控數字孿生平臺,探索形成地下工程災害由被動處治到主動、科學、智慧防控轉變的關鍵技術。

而浪潮資訊自2020年以來,持續參與了西湖大學算力平臺的建設,在這家建設初衷是將創新從零到一做起的學校,加速其在藥物科研等方面的探索。

復旦大學,則在與阿里雲、中國電信聯手打造CFFF平臺一年後,已有超300個科研團隊在這該平臺上開展研究,且幾乎都是跨學科團隊。一批垂直領域大模型也在此誕生和活躍,如國內首個多模態的對話式大語言模型——MOSS大語言模型;結合3D分子構象,預測藥物物理化學屬性的ADMET預測模型;研究長序列、細粒度的基因調控關係的女媧DNA大模型等。

值得一提的是,企業助力高校實現AI for Science的同時,高校們產出的科研成果,實際上也在反過來服務企業的客戶,實現某種意義上的Science for AI。

“比如,我們和某大學合作打造行業大模型的過程中,他們有研究幾十年的學術資料,我們有大模型和算力,透過合作,他們加速了科研成果的轉化,這些研發出來的產品,目前也正在面向我們的其他客戶,進行試點推廣。”一位行業人士表示。

某大學與百度雲合作,將某製造行業的一些需求用大模型跑通後,也能嫁接到百度的模型上來,去大範圍服務客戶。

也因此,業界觀察,目前不管是高校還是企業,都對AI領域的產學研合作抱以厚望。

最近的高校招標專案中,就有不少專案都與“產教融合”有關。比如上海交通大學的“面向產教融合的可擴充套件異構協同智算平臺”專案,哈爾濱工業大學的“人工智慧產教融合創新平臺總集”專案。

而在更早之前,復旦大學CFFF平臺正式上線時,中國工程院院士、阿里雲創始人王堅更是一度表示,復旦大學和阿里雲的合作是產學研協同的創新,“甚至可以像當年MIT跟貝爾實驗室合作使得今天的大學工學院有了通訊專業一樣,以產學研的合作創造出一個新領域、一個新機會。”

03

一些經驗正在形成

“AI for Science在材料、生命科學、能源化工等領域落地成果的不斷湧現,讓我們看到其帶來的巨大前景。但AI for Science帶來的不僅僅是點狀的突破,而是系統性地帶動科學研究基礎設施的建設,推進邁向‘平臺科研’時代。”2024年7月,在2024世界人工智慧大會的一場分論壇上,中國科學院院士鄂維南如是稱。

他同時強調,發展AI for Science,落地“平臺科研”模式,應該著重推進“四梁N柱”方面的綜合建設和發展。

其中,“四梁”,即指新一代科學研究的基礎設施,包括基本原理與資料驅動的演算法模型與軟體、高精度高效率的實驗表徵方法、替代文獻的資料庫與知識庫,以及高度整合的算力平臺。具體科學及產業問題,如新能源汽車、生命科學、能源材料等,則構成所謂的“N柱”。

在這種大背景下,最近兩年,高校和企業都在紛紛加速推動AI for Science的基礎設施建設。而在這個過程中,一些經驗也在相互合作中逐漸積累。

比如在大模型方面,一位大廠人士告訴數智前線,高校在選擇合作伙伴時,往往最為看中三方面的因素:公司體量是否夠大,能彌補他們資源上的優勢;算力和大模型技術方面的優勢是否突出;服務能力是否可持續,而不是一杆子買賣。而企業則看中高校科研團隊裡是否有資深的人才,更優質的行業資料等。

在科研計算平臺建設方面,復旦大學研究員程遠則在去年10月的一場大會上,分享了復旦大學的三大關鍵建設思路。

其一,要提高叢集計算的加速。尤其是在模型訓練相關領域,不僅要增加硬體算力,還需在並行訓練框架層面進行最佳化。

其二,將AI和HPC計算融合,以滿足不同科研計算需求。

其三,研發易於使用的AI4S工具,以滿足科學家對於AI易用性的需求。

隨著今年合作的深入,效率、穩定性、節能等是這波熱潮中,高校對算力基礎設施的基本要求。

圍繞這些需求,AI for Science基礎設施產業鏈上的一眾企業也在快速行動,推出對應的產品和服務。尤其是百度雲、阿里雲、騰訊雲、華為雲等多家雲廠商,都在這塊兒有不少探索。

百度繼上海交通大學後,在今年1月,與另一家985重點高校重慶大學簽署戰略合作協議,雙方將共建“重慶大學-百度智慧雲聯合創新中心”, 聚焦山地自動駕駛、大模型應用、資訊保安等前沿關鍵領域,聯合開展高水平科技創新,共同打造AI For Science科研計算平臺。

華為則依託智慧感知、智慧聯接、智慧中樞等全棧自主創新產品和平臺,構建起實驗室科研園區、科研服務、科研計算三大科研平臺能力,推出了智算實驗室解決方案,向外提供。

騰訊據悉也面向AI for Science浪潮,推出了“彈性服務、開箱即用”科研生態雲。

中國移動,在今年10月,釋出了AI賦能科學“AI For Science(AI4S)科學裝置智算節點”,並提供AI4S Station科學工作站平臺。該工作站集合了科研模型研發基礎工具集、科學模型服務平臺、生物蛋白等科學領域工具套件,提供端到端極簡科研開發流程,讓科學家專注自身專業領域,提升科研模型研發效率。

一些創業公司也同樣瞄準在了AI4S領域的基礎設施搭建。比如深勢科技,正在為有基礎科研需求的產業和企業提供AI4S研究工具和平臺。

AI for Science熱潮下,高校和企業還在持續不斷動作中……