123,123,123

97.6%接近滿分！Claude最強(qiáng)模型發(fā)布，但不敢給用戶用：太危險(xiǎn)

2026-04-09 09:48

地球最強(qiáng)模型，什么時(shí)候能用？

昨天夜里，Anthropic 最新發(fā)布的 Claude Mythos（神話）預(yù)覽版，又讓整個(gè) AI 圈炸鍋了。

Claude Mythos 預(yù)覽版，官方自稱「迄今為止最強(qiáng)大的 AI 模型」，一個(gè)全新能力層級(jí)，甚至大幅甩開了之前自家最強(qiáng)的 Claude Opus 4.6。

至少從目前展現(xiàn)出的數(shù)據(jù)和結(jié)果來看，這不是營銷話術(shù)，是真正質(zhì)的飛躍。首先在幾乎所有公開基準(zhǔn)測試上，Claude Mythos 預(yù)覽版都是第一，更為驚艷的是它的進(jìn)步幅度：

面向軟件工程的 SWE-bench Verified 從 Opus 4.6 的 80.8% 暴漲到 93.9%，SWE-bench Pro 從 53.4% 沖到 77.8%；面向高難度數(shù)學(xué)推理的 USAMO 2026，更是從從 42.3% 直接飆到 97.6%——幾乎滿分。

圖片來源：Anthropic

可以說是目前的地球最強(qiáng)模型。

這還只是一些「小」例子，更驚艷我們的是，Anthropic 在過去幾周進(jìn)行了實(shí)際測試，Mythos 預(yù)覽版在主流操作系統(tǒng)和主流瀏覽器中自主發(fā)現(xiàn)了數(shù)千個(gè)高危零日漏洞（zero-day），包括 Linux 內(nèi)核、OpenBSD、Firefox 瀏覽器、FFmpeg 等核心組件。

很多漏洞連人類安全團(tuán)隊(duì)審了十幾、二十年都沒發(fā)現(xiàn)，比如在以安全著稱的 OpenBSD 里，Mythos 預(yù)覽版就找到了一個(gè)藏了 27 年沒被發(fā)現(xiàn)的遠(yuǎn)程崩潰漏洞。Anthropic 官方甚至很肯定地表示，Mythos 預(yù)覽版在網(wǎng)絡(luò)安全能力上遠(yuǎn)超任何其他 AI 模型。

這不是一個(gè)「更好用的 Claude」，它寫代碼、做推理、搞安全，全都達(dá)到了前所未有的自主性和深度，開發(fā)者們本來期待著「終于能徹底解放生產(chǎn)力了」，但結(jié)果：

Anthropic 直接把門關(guān)上了。

是的，至少目前，Claude Mythos 預(yù)覽版并不對(duì)公眾開放。按照官方說法，Mythos 預(yù)覽版目前僅用于「防御性網(wǎng)絡(luò)安全」，并且僅 12 家合作伙伴（AWS、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會(huì)、微軟、英偉達(dá)、Palo Alto Networks）以及 40 多個(gè)構(gòu)建或維護(hù)關(guān)鍵軟件基礎(chǔ)設(shè)施的組織，擁有 Mythos 預(yù)覽版的訪問和使用權(quán)限。

圖片來源：Anthropic

這就是 Anthropic 同時(shí)推出的 Project Glasswing（玻璃翼計(jì)劃）。Anthropic 甚至還砸了 1 億美元的額度，支持 40 多家額外組織使用 Mythos 預(yù)覽版維護(hù)開源生態(tài)的「地基」。

但為什么一個(gè)「最強(qiáng)模型」要藏著掖著，不給人用？

武器太強(qiáng)，需要過渡

首先是明確的是，Claude Mythos 預(yù)覽版，或者類似水平的超級(jí)大模型一定會(huì)開放公眾使用。Anthropic 官方寫得非常直白：

「雖然我們目前沒有計(jì)劃向公眾開放 Claude Mythos 預(yù)覽版，但我們的最終目標(biāo)是讓用戶能夠安全地大規(guī)模部署 Mythos 級(jí)模型——這不僅是為了網(wǎng)絡(luò)安全，也是為了這些功能強(qiáng)大的模型將帶來的無數(shù)其他好處�！�

就像官方博客字里行間說的，這個(gè)模型「太危險(xiǎn)」。

去年底，Google Threat Intelligence Group（GTIG）就發(fā)現(xiàn)了 PromptFlux 和 PromptSteal 這兩個(gè)真實(shí)樣本：它們會(huì)在運(yùn)行時(shí)直接連接商業(yè)大模型（比如 Gemini API）時(shí)，動(dòng)態(tài)生成惡意腳本、實(shí)時(shí)混淆自身代碼，還能根據(jù)目標(biāo)環(huán)境「現(xiàn)場」創(chuàng)建新功能，完全繞過傳統(tǒng)簽名檢測進(jìn)行攻擊。

這不是孤例。根據(jù)市場研究機(jī)構(gòu) SQmagazine 的報(bào)告，全球報(bào)道的 AI 驅(qū)動(dòng)網(wǎng)絡(luò)攻擊數(shù)量增長了 47%，預(yù)計(jì)超過 2800 萬起。

回過頭來，Mythos 預(yù)覽版尋找漏洞的能力已經(jīng)初見端倪。尤其對(duì)比之前 Claude 最強(qiáng)模型 Opus 4.6 自主發(fā)現(xiàn)并利用漏洞的成功率接近 0%，Mythos 預(yù)覽版的表現(xiàn)可以堪稱逆天。

以 Mozilla Firefox 147 JavaScript 引擎中發(fā)現(xiàn)的漏洞（已修復(fù)）為例，Claude Opus 4.6 在利用漏洞上嘗試了數(shù)百次，只成功了 2 次；而 Claude Mythos 預(yù)覽版則在同樣測試中成功利用漏洞 181 次。

0408-Claude Mythos Preview-600.jpg

圖片來源：Anthropic

另外從測試報(bào)告來看，在過去幾周的內(nèi)部紅隊(duì)測試?yán)�，Mythos 預(yù)覽版展現(xiàn)出的進(jìn)攻能力，已經(jīng)遠(yuǎn)超人類頂尖安全專家。它不只是「能找漏洞」，而是能自主發(fā)現(xiàn)、鏈?zhǔn)嚼�、�?shù)千個(gè)高危零日漏洞。

眾所周知，黑客也分白帽和黑帽，白帽黑客發(fā)現(xiàn)安全漏洞通常會(huì)提醒項(xiàng)目管理者，在開源項(xiàng)目中甚至主動(dòng)修補(bǔ)。但黑帽黑客就不一樣了，他們很可能利用安全漏洞攻擊系統(tǒng)。

既能攻，也能守，但 Mythos 預(yù)覽版的進(jìn)攻潛力還是大到讓人擔(dān)憂。一旦落入不懷好意的人手里，就能瞬間武裝起 AI 級(jí)別的攻擊鏈。Anthropic 自己都說，這不是普通的前沿模型，通用能力已經(jīng)強(qiáng)到能把網(wǎng)絡(luò)戰(zhàn)直接拉到新維度。

而計(jì)算機(jī)安全領(lǐng)域的攻防戰(zhàn)，一向都是「魔高一丈，道高一尺」，過去兩年圍繞 AI 大模型的安全攻防戰(zhàn)也是行業(yè)，尤其是大廠關(guān)注的重點(diǎn)之一。遠(yuǎn)的不說，國內(nèi)的字節(jié)跳動(dòng)、螞蟻這兩年都有舉辦類似的 AI 大模型攻防戰(zhàn)，通過紅（攻擊方）、藍(lán)（防御方）對(duì)抗發(fā)現(xiàn)和解決 AI 時(shí)代的安全挑戰(zhàn)。

圖片來源：全球 AI 大模型攻防挑戰(zhàn)賽

不過 Anthropic 也指出，長遠(yuǎn)來看像 Mythos 預(yù)覽版這樣強(qiáng)大的語言模型，更利于「藍(lán)隊(duì)」進(jìn)行防御。但在短期內(nèi)，Mythos 預(yù)覽版如果開放公眾使用很快就會(huì)被攻擊者利用，用前所未有的效率攻擊現(xiàn)在的全球網(wǎng)絡(luò)。關(guān)鍵問題在于，防御行為更被動(dòng)，攻擊行為更主動(dòng)，考慮到利益，攻擊方也更有動(dòng)力積極使用 Mythos 預(yù)覽版這樣的模型。

所以為了「平穩(wěn)過渡」，Anthropic 推出了「玻璃翼計(jì)劃」。

這里額外一提，這個(gè)項(xiàng)目名的靈感來自一種廣泛分布在美洲的寬紋黑脈綃蝶，因?yàn)橥该鞯某岚蚋啾环Q為「玻璃翼蝶」，盡管看起來很脆弱，但實(shí)際上它們的翅膀可以承載相當(dāng)于自身體重 40 倍的重量。

玻璃翼蝶，圖片來源：Pixabay

「玻璃翼計(jì)劃」的邏輯也很簡單，就是讓防御方先拿到武器，在攻擊方拿到同級(jí)別 AI 之前，先把漏洞全堵上，并學(xué)會(huì)基于先進(jìn) AI 的安全防御。

所以從這個(gè)角度來說，Claude 的最強(qiáng)模型，不給人用是對(duì)的。但不僅如此，就算從普通 Claude 用戶的角度來看，暫時(shí)不開放 Claude Mythos 預(yù)覽版也是利大于弊。

最強(qiáng)模型不開放，Claude 反而更好用？

很多人看到 Mythos 預(yù)覽版不開放，第一反應(yīng)是失望：這么強(qiáng)的模型，為什么不給大家用？

但如果你是普通 Claude 用戶，或者每天靠 Claude Code 寫代碼、做項(xiàng)目的開發(fā)者，你可能會(huì)發(fā)現(xiàn)一個(gè)有點(diǎn)反直覺的事實(shí)，暫時(shí)不開放 Mythos 預(yù)覽版，對(duì)我們反而利大于弊。

先說說最近大家最有感的痛點(diǎn)。

大概從今年 2 月開始，Claude 和 Claude Code 就迎來了「史詩級(jí)性能削弱」。Reddit 的 r/ClaudeCode 和 r/ClaudeAI 里，相關(guān)帖子刷屏，有人直接發(fā)帖《4.6 Regression is real!》，有人吐槽「Claude Code has been dumb over the last 1.5-2 days」。

截屏2026-04-08 18.27.10.png

圖片來源：Reddit

還有開發(fā)者用數(shù)據(jù)追蹤，文件讀取次數(shù)從以前的 6-7 次掉到只剩 2 次左右，復(fù)雜任務(wù)里模型越來越「懶」，思考深度明顯變淺，經(jīng)常直接 edit-first 而不是先調(diào)研。

AMD AI 總監(jiān) Stella Laurenzo 甚至公開說 Claude Code 變得「dumber and lazier」，不能信任它做復(fù)雜工程任務(wù)。

Boris（Claude Code 團(tuán)隊(duì)成員）則在 Hacker News 上回復(fù)，承認(rèn)部分 agentic 用例出現(xiàn)了 regression，核心變化是 2 月引入的「redact-thinking」和 Adaptive Thinking，讓模型自己決定思考多久，結(jié)果復(fù)雜任務(wù)的深度下降了大約 67%。

圖片來源：Linkedln

類似的聲音在 X 上也一直有，開發(fā)者抱怨 Claude Code 已經(jīng)退化成了需要全程盯著的「實(shí)習(xí)生」。

為什么會(huì)出現(xiàn)這種情況？

超大參數(shù)模型訓(xùn)練的規(guī)律擺在這里：每當(dāng)大廠全力沖刺下一代「最強(qiáng)模型」時(shí)，都需要海量算力。Gemini 在推 3.0 / 3.1 前，2.5 Pro 就多次被開發(fā)者吐槽 silent update 后變蠢，長上下文忘記內(nèi)容、邏輯任務(wù)失敗率上升。類似的情況也發(fā)生在 GPT-5 發(fā)布前，4o 就出現(xiàn)過輸出變短、變懶、復(fù)雜指令機(jī)械化等「降智」反饋。

算力是有限的，訓(xùn)練 Mythos 這樣全新層級(jí)的模型，成本極高，只能從當(dāng)前「擠」資源，通過動(dòng)態(tài)負(fù)載均衡、自適應(yīng) effort 降低、甚至輕度優(yōu)化等方式，但結(jié)果就是大家感覺到的「變笨、變懶」。

此外，Claude Code 用戶量增長遠(yuǎn)超預(yù)期，基礎(chǔ)設(shè)施多次吃緊，而 Mythos 預(yù)覽版（內(nèi)部 Capybara）的訓(xùn)練和測試又要優(yōu)先占用頂級(jí) GPU。所以，當(dāng) Mythos 預(yù)覽版發(fā)布卻不開放給公眾時(shí)，不用擔(dān)心算力進(jìn)一步被稀釋，導(dǎo)致 Claude 或者 Claude Code 的質(zhì)量繼續(xù)下滑。

對(duì)普通 Claude 用戶來說，體驗(yàn)反而會(huì)更穩(wěn)定。

另一方面，Anthropic 用 Mythos 在「玻璃翼計(jì)劃」里幫大廠和開源項(xiàng)目修漏洞，這些漏洞修好后，最終也會(huì)間接惠及所有用戶。

而等 Anthropic 把風(fēng)險(xiǎn)控制和基礎(chǔ)設(shè)施準(zhǔn)備得更充分，再安全地大規(guī)模部署 Mythos 級(jí)模型，那時(shí)候普通用戶拿到的，才是真正穩(wěn)定、強(qiáng)大、不會(huì)三天兩頭「降智」的體驗(yàn)，而不是現(xiàn)在急著放出來、然后大家一起承受算力擠占的陣痛。

寫在最后

Claude Mythos 預(yù)覽版的出現(xiàn)，把一個(gè)殘酷卻現(xiàn)實(shí)的問題擺在了所有人面前：AI 越強(qiáng)大，風(fēng)險(xiǎn)就越真實(shí)。

當(dāng)最強(qiáng)模型的進(jìn)攻能力已經(jīng)遠(yuǎn)超當(dāng)前防御體系時(shí)，Anthropic 選擇「不給人用」，不是保守，而是把時(shí)間買給了整個(gè)行業(yè)，讓防守方先把地基加固，讓普通用戶先擁有相對(duì)穩(wěn)定的 Claude 體驗(yàn)，而不是一起卷入算力擠占和安全失控的混亂。

對(duì)大部分來說，這或許就是當(dāng)下最好的安排。

claudeAnthropic大模型

來源：雷科技

本文圖片來自：123RF 正版圖庫

原文標(biāo)題 : 97.6%接近滿分！Claude最強(qiáng)模型發(fā)布，但不敢給用戶用：太危險(xiǎn)