AI強大至尋「隱形漏洞」,Anthropic顧慮遭駭客濫用限制發布

Anthropic公司於本週二宣布推出名為「Claude Mythos Preview」的先進人工智慧模型,並將透過一項名為「Project Glasswing」的網路安全計畫逐步推向極少數的合作企業。該模型在識別軟體中的弱點與安全漏洞方面表現傑出,但anthropic明確限制了模型的存取權,目的便是阻止惡意行為者濫用其強大的能力。參與初期計畫的夥伴包括蘋果、谷歌、微軟、Nvidia和亞馬遜雲端服務等科技巨頭,除此之外,還有超過四十家包括CrowdStrike和Palo Alto Networks在內的企業共同參與。

Anthropic強調,此舉是為了讓網路安全防禦方能提前掌握這項日益重要的技術。該模型雖然具備超強的程式碼編寫與推理能力,使其能夠發現過去難以察覺的關鍵錯誤,甚至成功找出OpenBSD系統中一個已存在二十七年的漏洞。值得注意的是,anthropic坦承,Mythos Preview是一個通用型模型,而非專門為網路安全訓練。

此項宣布發生在anthropic的模型描述曾被媒體曝光,一度引發了網路安全相關股票的波動。anthropic方深知模型帶來的風險,因此採取了極度謹慎的策略,並表示與美國政府官員持續進行討論。他們決定將模型部署限制在關鍵基礎設施的維護方,目的是讓產業體質逐步適應利用此類能力,避免因過早、不負責任地釋出模型而遭到敵對勢力利用。anthropic承諾投入大量使用額度,但超過此額度後,合作夥伴須付費使用。

從我的角度來看,這份報告的核心論點遠超過單純介紹一個新工具。它描繪的是當前人工智慧產業在「前沿能力釋放」與「國家安全風險管控」之間的極度拉扯狀態。anthropic的每一步行動,都展現了對其模型潛在威脅的深刻認知。他們選擇的「限制存取」和「預先教育客戶」的策略,看似是謹慎,實則是在建立一個壟斷性的、難以繞開的行業標準。

這場遊戲的牌面,已經從單純的技術競賽,變成了權力與風險管理的博弈。透過對初期合作夥伴的嚴格篩選,anthropic不僅在規避了公眾的質疑,更成功地將自己定位為行業內唯一、且最受信任的「安全守門人」。這種主動的限制,反而為其募資和制定行業標準提供了最堅不可摧的道德與技術壁壘。未來市場不會關注模型有多強,而是關注誰能最「有責任」地掌握並應用這股極致的力量。

原文網頁:Anthropic limits Mythos AI rollout over fears hackers could use it for attacks (by Ashley Capoot)

Comments

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *