當Anthropic在2026年3月底不慎外洩一份內部草稿時,沒人想到這會掀起一場橫跨華府、科技巨頭與華爾街的恐慌。草稿中提到的「Claude Mythos Preview」(又稱Capybara),被描述為「我們有史以來最強大的AI模型」——不僅在編碼、推理與數學上實現「步進式躍進」(step change),更在網路安全領域展現前所未有的自主攻擊能力:它能獨立發現並鏈接零日漏洞(zero-day),讓駭客從「需要專家團隊數月」變成「AI一夜搞定」。
這不是科幻小說。Anthropic官方在4月7日發布的《系統卡》(System Card)與Project Glasswing公告中確認:Mythos Preview已在每一個主流作業系統(Windows、macOS、Linux)和網頁瀏覽器中找出數千個高嚴重度漏洞,包括一個隱藏27年的OpenBSD遠端崩潰漏洞、一個被500萬次自動測試忽略的FFmpeg 16年老漏洞,以及Linux核心中可實現使用者到root權限升級的鏈接漏洞。
更可怕的是,它不只是「找漏洞」——它能自主產生概念驗證(PoC)攻擊程式碼,在CyberGym基準測試中達到83.1%成功率(前一代Claude Opus 4.6僅66.6%),Cybench CTF挑戰更是100%全過。它在真實企業網路模擬中,獨立完成超過10小時專家級攻擊流程。
為什麼這讓美國政府與科技巨頭徹夜難眠?
- 攻防失衡的「末日級」雙重用途:Mythos的出現,把網路攻擊的「發現到利用」窗口從數月壓縮到數分鐘。Anthropic自己在公告中警告:「如果落入不負責任的行為者手中,將導致更頻繁、更具破壞性的網路攻擊,威脅經濟、公共安全與國家安全。」 美國財政部與聯準會已緊急召集銀行執行長開會,英國金融監管單位也加速評估風險。華府官員私下承認,這可能是「AI時代第一個真正改變國家安全格局的模型」。
- 關鍵基礎設施全線暴露:Mythos已證實能在Firefox、Chrome、Linux核心等全球依賴的軟體中找到未修補漏洞99%以上尚未被修復。參與Project Glasswing的40多家機構(包括AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrike、JPMorgan Chase、Linux基金會等)正緊急用它掃描自家與開源系統,但外界擔心:這些「防禦特權」若外洩,或其他國家/犯罪集團複製類似模型,後果不堪設想。
- Anthropic自己也怕:這家公司以「憲法AI」與安全聞名,卻首次決定不對公眾開放Mythos。系統卡明確指出:儘管它是「迄今對齊最好的模型」,但能力提升也讓「罕見的錯位行為」後果更嚴重。它在RSP v3.0(負責任擴展政策)評估中,網路災難風險被視為需嚴格管制,自動AI研發門檻雖未完全觸發,但「信心度比以往任何模型都低」。
Anthropic的「救贖計劃」:Project Glasswing
面對自己創造的怪物,Anthropic選擇「防禦優先」:推出Project Glasswing,投入1億美元使用額度與400萬美元捐款,讓上述巨頭與40多家關鍵基礎設施維護者有限制地使用Mythos掃描與修補漏洞。未來將透過Claude API、AWS Bedrock、Google Vertex AI與Microsoft Foundry以高價提供給「 vetted partners」。
這聽起來像負責任,但也引發質疑:為何只有科技寡頭能用?中小企業與獨立研究者呢?更何況Anthropic正與五角大廈因「無限制軍事使用」要求而鬧上法院(已被列為供應鏈風險),卻同時讓Google、Microsoft這些競爭對手先用——這是真正的「行業共治」,還是權力集中的新形式?
調查洞見:這不是結束,而是AI安全新紀元的開端
Mythos的出現,證實了AI安全專家長期警告的「能力躍進」已到來。Anthropic共同創辦人Jack Clark公開表示,公司正與美國政府持續對話。但同時,華府內部已有人將其視為「國家安全新威脅」。部分網路安全專家則懷疑:這是否只是行銷噱頭?畢竟Anthropic拒絕公開完整基準細節,且目前只有「 vetted」使用者能驗證。
無論如何,一件事已成定局:AI不再只是「聊天機器人」,它已成為能自主重塑網路攻防平衡的戰略武器。當下一次更強的Mythos級模型出現時——可能就在幾個月後——人類還來得及修補所有漏洞嗎?
還是,我們正目睹「AI軍備競賽」真正開始,而Mythos只是第一顆信號彈?