Good Luck To You!

手机扫一扫

支援中英雙語及40種方言任意混說,中國電信TeleAI星辰語音大模型升級

鳳凰科技 2024-11-04 01:33:43 3

IT之家 11 月 3 日訊息,中國電信人工智慧研究院(TeleAI)在今年 5 月釋出業內首個支援 30 種方言自由混說的語音識別大模型 —— 星辰超多方言語音識別大模型。

時隔不到半年,TeleAI 星辰語音大模型的多方言能力再次升級,攻克了湛江話、宜賓話、洛陽話、煙臺話等方言,將方言種類從 30 種提升至 40 種,並引入對英文的識別。

與傳統的有標註訓練方法相比,TeleAI 透過預訓練語音識別模型,利用海量無標註資料進行預訓練,再透過少量有標註資料進行微調。

由於方言語音資料普遍存在無標註資料多而有標註資料少的特點,這種“預訓練 + 微調”的模型方案與方言場景的需求能夠高度契合。

TeleAI 還在模型結構和成本最佳化上進行了創新,實現對人工標註資料的需求量大幅降低約 50 倍,且保障模型效果與有監督訓練的方言模型水平相當。

IT之家附 GitHub 開源地址:https://github.com/Tele-AI/TeleSpeech-ASR