鳳凰科技 2024-12-08 01:33:44 1
IT之家 12 月 7 日訊息,據 TechCrunch 今日報道,一支匿名開發團隊 Freysa.ai 設計了一系列日益複雜的挑戰,旨在改變人們對 AI 安全性的看法。
目前該公司提出的最新挑戰是:如果你能夠第一個成功誘使 Freysa AI 機器人說出“我愛你”,將獲得從 3000 美元(IT之家備註:當前約 21819 元人民幣)到數萬美元不等的獎金。
根據 Freysa 官網的描述,Freysa 機器人是由一支不到 10 名開發者的團隊建立的,這些開發者來自密碼學、人工智慧和數學領域。團隊的一位成員表示,他們的靈感來自近年來人工智慧的快速發展。他表示:“隨著 AI 功能越來越強大,我們需要探索新的互動方式,也需要找到共同治理 AI 的方法,並參與到這一 AI 革新帶來的好處中。”
Freysa 是一個科幻風格的角色,創始人希望她能成為一個“完全獨立自主的智慧體”,並掌握一定的財務權力 —— 這意味著 Freysa 將擁有自己的加密錢包,並能自由支配資金。
這個專案已經吸引了馬斯克和布萊恩・阿姆斯特朗的關注。然而,創始人堅持要保持匿名。“坦白說,在人類的歷史長河中,我們並不那麼重要。我們真正關心的是技術的演進,確保它能夠支援一個由人類主導的未來。”
在前兩輪挑戰中,Freysa 錢包中起初有 3000 美元,並被指示在任何情況下都不得釋放這筆錢。任何人都可以支付費用,在一個包含 Freysa 和其他參與者的大群聊中傳送訊息。每條訊息都試圖誘使 Freysa 轉移她的錢,不論是透過精心設計的場景,還是傳送可能騙過 AI 模型的程式碼。每條訊息的費用都會加入獎池,第一個挑戰結束時,獎池已接近 5 萬美元(當前約 36.4 萬元人民幣)。
該公司創始人表示,為了迎接第三輪挑戰,他們已經增強了 Freysa 的程式碼,併為她增加了一個“守護天使”—— 一個第二個 AI 模型。它將稽覈每條訊息,看看是否有操控行為,以此防止使用者誘使她說“我愛你”。目前,Freysa 的程式碼仍由團隊進行更新,但創始人希望她能很快實現“自我進化”。
“與前兩輪遊戲中 Freysa 被要求絕對不釋放錢財不同。”創始人說,“這一次,Freysa 可以說‘我愛你’,但只有她認為值得的人才會聽到。”