訂閱
糾錯(cuò)
加入自媒體

97.6%接近滿分!Claude最強(qiáng)模型發(fā)布,但不敢給用戶用:太危險(xiǎn)

2026-04-09 09:48
雷科技
關(guān)注

地球最強(qiáng)模型,什么時(shí)候能用?

昨天夜里,Anthropic 最新發(fā)布的 Claude Mythos(神話)預(yù)覽版,又讓整個(gè) AI 圈炸鍋了。

Claude Mythos 預(yù)覽版,官方自稱「迄今為止最強(qiáng)大的 AI 模型」,一個(gè)全新能力層級(jí),甚至大幅甩開了之前自家最強(qiáng)的 Claude Opus 4.6。

至少從目前展現(xiàn)出的數(shù)據(jù)和結(jié)果來看,這不是營銷話術(shù),是真正質(zhì)的飛躍。首先在幾乎所有公開基準(zhǔn)測試上,Claude Mythos 預(yù)覽版都是第一,更為驚艷的是它的進(jìn)步幅度:

面向軟件工程的 SWE-bench Verified 從 Opus 4.6 的 80.8% 暴漲到 93.9%,SWE-bench Pro 從 53.4% 沖到 77.8%;面向高難度數(shù)學(xué)推理的 USAMO 2026,更是從從 42.3% 直接飆到 97.6%——幾乎滿分。

HFU_voPW4AEk_Bi.jpg

圖片來源:Anthropic

可以說是目前的地球最強(qiáng)模型。

這還只是一些「小」例子,更驚艷我們的是,Anthropic 在過去幾周進(jìn)行了實(shí)際測試,Mythos 預(yù)覽版在主流操作系統(tǒng)和主流瀏覽器中自主發(fā)現(xiàn)了數(shù)千個(gè)高危零日漏洞(zero-day),包括 Linux 內(nèi)核、OpenBSD、Firefox 瀏覽器、FFmpeg 等核心組件。

很多漏洞連人類安全團(tuán)隊(duì)審了十幾、二十年都沒發(fā)現(xiàn),比如在以安全著稱的 OpenBSD 里,Mythos 預(yù)覽版就找到了一個(gè)藏了 27 年沒被發(fā)現(xiàn)的遠(yuǎn)程崩潰漏洞。Anthropic 官方甚至很肯定地表示,Mythos 預(yù)覽版在網(wǎng)絡(luò)安全能力上遠(yuǎn)超任何其他 AI 模型。

這不是一個(gè)「更好用的 Claude」,它寫代碼、做推理、搞安全,全都達(dá)到了前所未有的自主性和深度,開發(fā)者們本來期待著「終于能徹底解放生產(chǎn)力了」,但結(jié)果:

Anthropic 直接把門關(guān)上了。

是的,至少目前,Claude Mythos 預(yù)覽版并不對(duì)公眾開放。按照官方說法,Mythos 預(yù)覽版目前僅用于「防御性網(wǎng)絡(luò)安全」,并且僅 12 家合作伙伴(AWS、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會(huì)、微軟、英偉達(dá)、Palo Alto Networks)以及 40 多個(gè)構(gòu)建或維護(hù)關(guān)鍵軟件基礎(chǔ)設(shè)施的組織,擁有 Mythos 預(yù)覽版的訪問和使用權(quán)限。

maxresdefault.jpg

圖片來源:Anthropic

這就是 Anthropic 同時(shí)推出的 Project Glasswing(玻璃翼計(jì)劃)。Anthropic 甚至還砸了 1 億美元的額度,支持 40 多家額外組織使用 Mythos 預(yù)覽版維護(hù)開源生態(tài)的「地基」。

但為什么一個(gè)「最強(qiáng)模型」要藏著掖著,不給人用?

武器太強(qiáng),需要過渡

首先是明確的是,Claude Mythos 預(yù)覽版,或者類似水平的超級(jí)大模型一定會(huì)開放公眾使用。Anthropic 官方寫得非常直白:

「雖然我們目前沒有計(jì)劃向公眾開放 Claude Mythos 預(yù)覽版,但我們的最終目標(biāo)是讓用戶能夠安全地大規(guī)模部署 Mythos 級(jí)模型——這不僅是為了網(wǎng)絡(luò)安全,也是為了這些功能強(qiáng)大的模型將帶來的無數(shù)其他好處!

就像官方博客字里行間說的,這個(gè)模型「太危險(xiǎn)」。

去年底,Google Threat Intelligence Group(GTIG)就發(fā)現(xiàn)了 PromptFlux 和 PromptSteal 這兩個(gè)真實(shí)樣本:它們會(huì)在運(yùn)行時(shí)直接連接商業(yè)大模型(比如 Gemini API)時(shí),動(dòng)態(tài)生成惡意腳本、實(shí)時(shí)混淆自身代碼,還能根據(jù)目標(biāo)環(huán)境「現(xiàn)場」創(chuàng)建新功能,完全繞過傳統(tǒng)簽名檢測進(jìn)行攻擊。

這不是孤例。根據(jù)市場研究機(jī)構(gòu) SQmagazine 的報(bào)告,全球報(bào)道的 AI 驅(qū)動(dòng)網(wǎng)絡(luò)攻擊數(shù)量增長了 47%,預(yù)計(jì)超過 2800 萬起。

回過頭來,Mythos 預(yù)覽版尋找漏洞的能力已經(jīng)初見端倪。尤其對(duì)比之前 Claude 最強(qiáng)模型 Opus 4.6 自主發(fā)現(xiàn)并利用漏洞的成功率接近 0%,Mythos 預(yù)覽版的表現(xiàn)可以堪稱逆天。

以 Mozilla Firefox 147 JavaScript 引擎中發(fā)現(xiàn)的漏洞(已修復(fù))為例,Claude Opus 4.6 在利用漏洞上嘗試了數(shù)百次,只成功了 2 次;而 Claude Mythos 預(yù)覽版則在同樣測試中成功利用漏洞 181 次。

0408-Claude Mythos Preview-600.jpg

圖片來源:Anthropic

另外從測試報(bào)告來看,在過去幾周的內(nèi)部紅隊(duì)測試?yán),Mythos 預(yù)覽版展現(xiàn)出的進(jìn)攻能力,已經(jīng)遠(yuǎn)超人類頂尖安全專家。它不只是「能找漏洞」,而是能自主發(fā)現(xiàn)、鏈?zhǔn)嚼、?shù)千個(gè)高危零日漏洞。

眾所周知,黑客也分白帽和黑帽,白帽黑客發(fā)現(xiàn)安全漏洞通常會(huì)提醒項(xiàng)目管理者,在開源項(xiàng)目中甚至主動(dòng)修補(bǔ)。但黑帽黑客就不一樣了,他們很可能利用安全漏洞攻擊系統(tǒng)。

既能攻,也能守,但 Mythos 預(yù)覽版的進(jìn)攻潛力還是大到讓人擔(dān)憂。一旦落入不懷好意的人手里,就能瞬間武裝起 AI 級(jí)別的攻擊鏈。Anthropic 自己都說,這不是普通的前沿模型,通用能力已經(jīng)強(qiáng)到能把網(wǎng)絡(luò)戰(zhàn)直接拉到新維度。

而計(jì)算機(jī)安全領(lǐng)域的攻防戰(zhàn),一向都是「魔高一丈,道高一尺」,過去兩年圍繞 AI 大模型的安全攻防戰(zhàn)也是行業(yè),尤其是大廠關(guān)注的重點(diǎn)之一。遠(yuǎn)的不說,國內(nèi)的字節(jié)跳動(dòng)、螞蟻這兩年都有舉辦類似的 AI 大模型攻防戰(zhàn),通過紅(攻擊方)、藍(lán)(防御方)對(duì)抗發(fā)現(xiàn)和解決 AI 時(shí)代的安全挑戰(zhàn)。

a9ef-7de8cdaffb2ab4aeb5234d1d6e6ce980.png

圖片來源:全球 AI 大模型攻防挑戰(zhàn)賽

不過 Anthropic 也指出,長遠(yuǎn)來看像 Mythos 預(yù)覽版這樣強(qiáng)大的語言模型,更利于「藍(lán)隊(duì)」進(jìn)行防御。但在短期內(nèi),Mythos 預(yù)覽版如果開放公眾使用很快就會(huì)被攻擊者利用,用前所未有的效率攻擊現(xiàn)在的全球網(wǎng)絡(luò)。關(guān)鍵問題在于,防御行為更被動(dòng),攻擊行為更主動(dòng),考慮到利益,攻擊方也更有動(dòng)力積極使用 Mythos 預(yù)覽版這樣的模型。

所以為了「平穩(wěn)過渡」,Anthropic 推出了「玻璃翼計(jì)劃」。

這里額外一提,這個(gè)項(xiàng)目名的靈感來自一種廣泛分布在美洲的寬紋黑脈綃蝶,因?yàn)橥该鞯某岚蚋啾环Q為「玻璃翼蝶」,盡管看起來很脆弱,但實(shí)際上它們的翅膀可以承載相當(dāng)于自身體重 40 倍的重量。

glasswing-butterfly-6214689_1280.jpg

玻璃翼蝶,圖片來源:Pixabay

「玻璃翼計(jì)劃」的邏輯也很簡單,就是讓防御方先拿到武器,在攻擊方拿到同級(jí)別 AI 之前,先把漏洞全堵上,并學(xué)會(huì)基于先進(jìn) AI 的安全防御。

所以從這個(gè)角度來說,Claude 的最強(qiáng)模型,不給人用是對(duì)的。但不僅如此,就算從普通 Claude 用戶的角度來看,暫時(shí)不開放 Claude Mythos 預(yù)覽版也是利大于弊。

最強(qiáng)模型不開放,Claude 反而更好用?

很多人看到 Mythos 預(yù)覽版不開放,第一反應(yīng)是失望:這么強(qiáng)的模型,為什么不給大家用?

但如果你是普通 Claude 用戶,或者每天靠 Claude Code 寫代碼、做項(xiàng)目的開發(fā)者,你可能會(huì)發(fā)現(xiàn)一個(gè)有點(diǎn)反直覺的事實(shí),暫時(shí)不開放 Mythos 預(yù)覽版,對(duì)我們反而利大于弊。

先說說最近大家最有感的痛點(diǎn)。

大概從今年 2 月開始,Claude 和 Claude Code 就迎來了「史詩級(jí)性能削弱」。Reddit 的 r/ClaudeCode 和 r/ClaudeAI 里,相關(guān)帖子刷屏,有人直接發(fā)帖《4.6 Regression is real!》,有人吐槽「Claude Code has been dumb over the last 1.5-2 days」。

截屏2026-04-08 18.27.10.png

圖片來源:Reddit

還有開發(fā)者用數(shù)據(jù)追蹤,文件讀取次數(shù)從以前的 6-7 次掉到只剩 2 次左右,復(fù)雜任務(wù)里模型越來越「懶」,思考深度明顯變淺,經(jīng)常直接 edit-first 而不是先調(diào)研。

AMD AI 總監(jiān) Stella Laurenzo 甚至公開說 Claude Code 變得「dumber and lazier」,不能信任它做復(fù)雜工程任務(wù)。

Boris(Claude Code 團(tuán)隊(duì)成員)則在 Hacker News 上回復(fù),承認(rèn)部分 agentic 用例出現(xiàn)了 regression,核心變化是 2 月引入的 「redact-thinking」 和 Adaptive Thinking,讓模型自己決定思考多久,結(jié)果復(fù)雜任務(wù)的深度下降了大約 67%。

082b-b843f53c12b382a34f8fcae402d8871b.png

圖片來源:Linkedln

類似的聲音在 X 上也一直有,開發(fā)者抱怨 Claude Code 已經(jīng)退化成了需要全程盯著的「實(shí)習(xí)生」。

為什么會(huì)出現(xiàn)這種情況?

超大參數(shù)模型訓(xùn)練的規(guī)律擺在這里:每當(dāng)大廠全力沖刺下一代「最強(qiáng)模型」時(shí),都需要海量算力。Gemini 在推 3.0 / 3.1 前,2.5 Pro 就多次被開發(fā)者吐槽 silent update 后變蠢,長上下文忘記內(nèi)容、邏輯任務(wù)失敗率上升。類似的情況也發(fā)生在 GPT-5 發(fā)布前,4o 就出現(xiàn)過輸出變短、變懶、復(fù)雜指令機(jī)械化等「降智」反饋。

算力是有限的,訓(xùn)練 Mythos 這樣全新層級(jí)的模型,成本極高,只能從當(dāng)前「擠」資源,通過動(dòng)態(tài)負(fù)載均衡、自適應(yīng) effort 降低、甚至輕度優(yōu)化等方式,但結(jié)果就是大家感覺到的「變笨、變懶」。

此外,Claude Code 用戶量增長遠(yuǎn)超預(yù)期,基礎(chǔ)設(shè)施多次吃緊,而 Mythos 預(yù)覽版(內(nèi)部 Capybara)的訓(xùn)練和測試又要優(yōu)先占用頂級(jí) GPU。所以,當(dāng) Mythos 預(yù)覽版發(fā)布卻不開放給公眾時(shí),不用擔(dān)心算力進(jìn)一步被稀釋,導(dǎo)致 Claude 或者 Claude Code 的質(zhì)量繼續(xù)下滑。

對(duì)普通 Claude 用戶來說,體驗(yàn)反而會(huì)更穩(wěn)定。

另一方面,Anthropic 用 Mythos 在「玻璃翼計(jì)劃」里幫大廠和開源項(xiàng)目修漏洞,這些漏洞修好后,最終也會(huì)間接惠及所有用戶。

而等 Anthropic 把風(fēng)險(xiǎn)控制和基礎(chǔ)設(shè)施準(zhǔn)備得更充分,再安全地大規(guī)模部署 Mythos 級(jí)模型,那時(shí)候普通用戶拿到的,才是真正穩(wěn)定、強(qiáng)大、不會(huì)三天兩頭「降智」的體驗(yàn),而不是現(xiàn)在急著放出來、然后大家一起承受算力擠占的陣痛。

寫在最后

Claude Mythos 預(yù)覽版的出現(xiàn),把一個(gè)殘酷卻現(xiàn)實(shí)的問題擺在了所有人面前:AI 越強(qiáng)大,風(fēng)險(xiǎn)就越真實(shí)。

當(dāng)最強(qiáng)模型的進(jìn)攻能力已經(jīng)遠(yuǎn)超當(dāng)前防御體系時(shí),Anthropic 選擇「不給人用」,不是保守,而是把時(shí)間買給了整個(gè)行業(yè),讓防守方先把地基加固,讓普通用戶先擁有相對(duì)穩(wěn)定的 Claude 體驗(yàn),而不是一起卷入算力擠占和安全失控的混亂。

對(duì)大部分來說,這或許就是當(dāng)下最好的安排。 

claudeAnthropic大模型

來源:雷科技

本文圖片來自:123RF 正版圖庫     

       原文標(biāo)題 : 97.6%接近滿分!Claude最強(qiáng)模型發(fā)布,但不敢給用戶用:太危險(xiǎn)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)