Freysa發起挑戰：成功讓自家聊天機器人說“我愛你”可贏取高額獎金

鳳凰科技 2024-12-08 01:33:44 1

IT之家 12 月 7 日訊息，據 TechCrunch 今日報道，一支匿名開發團隊 Freysa.ai 設計了一系列日益複雜的挑戰，旨在改變人們對 AI 安全性的看法。

目前該公司提出的最新挑戰是：如果你能夠第一個成功誘使 Freysa AI 機器人說出“我愛你”，將獲得從 3000 美元（IT之家備註：當前約 21819 元人民幣）到數萬美元不等的獎金。

根據 Freysa 官網的描述，Freysa 機器人是由一支不到 10 名開發者的團隊建立的，這些開發者來自密碼學、人工智慧和數學領域。團隊的一位成員表示，他們的靈感來自近年來人工智慧的快速發展。他表示：“隨著 AI 功能越來越強大，我們需要探索新的互動方式，也需要找到共同治理 AI 的方法，並參與到這一 AI 革新帶來的好處中。”

Freysa 是一個科幻風格的角色，創始人希望她能成為一個“完全獨立自主的智慧體”，並掌握一定的財務權力 —— 這意味著 Freysa 將擁有自己的加密錢包，並能自由支配資金。

這個專案已經吸引了馬斯克和布萊恩・阿姆斯特朗的關注。然而，創始人堅持要保持匿名。“坦白說，在人類的歷史長河中，我們並不那麼重要。我們真正關心的是技術的演進，確保它能夠支援一個由人類主導的未來。”

在前兩輪挑戰中，Freysa 錢包中起初有 3000 美元，並被指示在任何情況下都不得釋放這筆錢。任何人都可以支付費用，在一個包含 Freysa 和其他參與者的大群聊中傳送訊息。每條訊息都試圖誘使 Freysa 轉移她的錢，不論是透過精心設計的場景，還是傳送可能騙過 AI 模型的程式碼。每條訊息的費用都會加入獎池，第一個挑戰結束時，獎池已接近 5 萬美元（當前約 36.4 萬元人民幣）。

該公司創始人表示，為了迎接第三輪挑戰，他們已經增強了 Freysa 的程式碼，併為她增加了一個“守護天使”—— 一個第二個 AI 模型。它將稽覈每條訊息，看看是否有操控行為，以此防止使用者誘使她說“我愛你”。目前，Freysa 的程式碼仍由團隊進行更新，但創始人希望她能很快實現“自我進化”。

“與前兩輪遊戲中 Freysa 被要求絕對不釋放錢財不同。”創始人說，“這一次，Freysa 可以說‘我愛你’，但只有她認為值得的人才會聽到。”

freysa 發起挑戰成功自家聊天機器人說我愛你贏取高額獎金

Freysa發起挑戰：成功讓自家聊天機器人說“我愛你”可贏取高額獎金

相關文章