訂閱
糾錯(cuò)
加入自媒體

Kimi K2.6:大模型進(jìn)入“長(zhǎng)程執(zhí)行”時(shí)代

圖片

4月20日,謠傳即將發(fā)布的DeepSeek V4讓AI愛(ài)好者們的愿望再次落空。

但臨近午夜,月明星稀之時(shí),月之暗面悄悄給人們帶來(lái)了驚喜:

全新的Kimi K2.6模型正式發(fā)布并直接開(kāi)源。

在過(guò)去的一年里,國(guó)內(nèi)AI模型群雄逐鹿,幾乎每天都有刷新人們認(rèn)知的新消息。

而中文互聯(lián)網(wǎng)對(duì)大模型的討論也已經(jīng)經(jīng)過(guò)了三輪競(jìng)爭(zhēng)周期:

第一輪是堆砌參數(shù)量的比拼,第二輪是上下文長(zhǎng)度的競(jìng)爭(zhēng),第三輪則是喜聞樂(lè)見(jiàn)的價(jià)格戰(zhàn)。

但Kimi K2.6的誕生,意味著月之暗面也率先進(jìn)入了大模型競(jìng)爭(zhēng)的下半場(chǎng)深水區(qū),也就是長(zhǎng)程執(zhí)行(Long-range Reasoning & Execution)。

盡管在這個(gè)值得歡喜的日子潑冷水有些不解風(fēng)情,但我們?nèi)匀槐仨氈泵嬉粋(gè)客觀存在的分水嶺。

在不考慮多模態(tài)的前提下,國(guó)內(nèi)外AI模型的水平已經(jīng)出現(xiàn)了明確的代差。

剛剛發(fā)布Claude Opus 4.7的Anthropic和更新的Codex的OpenAI在編程等強(qiáng)邏輯領(lǐng)域已經(jīng)遙遙領(lǐng)先,這些產(chǎn)品也成為擁有訪問(wèn)渠道且預(yù)算充足的開(kāi)發(fā)者的首選。

國(guó)產(chǎn)AI企業(yè)推出的新產(chǎn)品,本質(zhì)上還是追趕兩家企業(yè)上一代的旗艦?zāi)P,并以此?jìng)爭(zhēng)成為其余開(kāi)發(fā)者們的“國(guó)產(chǎn)平替”。

這種平替的戰(zhàn)略并非被動(dòng)防守,而是在性能分水嶺明確的現(xiàn)狀下,通過(guò)極致的執(zhí)行力和本土化適配試圖在中國(guó)AI領(lǐng)域內(nèi)生根發(fā)芽。

如果說(shuō)Kimi的上半場(chǎng)憑借長(zhǎng)文本和超大參數(shù)量贏得了用戶(hù)心智,那么K2.6的出現(xiàn)則宣告了戰(zhàn)略重心的轉(zhuǎn)移:從一個(gè)信息容器,到一臺(tái)執(zhí)行引擎。

讀完十萬(wàn)字的文檔、做好幾十頁(yè)的PPT、下單網(wǎng)購(gòu)各種產(chǎn)品,那是上個(gè)時(shí)代(盡管只過(guò)去了兩個(gè)月)的Agent做的事。

而Kimi K2.6,是一個(gè)可以連續(xù)工作13小時(shí)、指揮300個(gè)下屬“數(shù)字牛馬”、獨(dú)立交付數(shù)千行工業(yè)級(jí)代碼的“數(shù)字承包商”。

這場(chǎng)深夜發(fā)布的背后,也隱藏著CEO楊植麟對(duì)規(guī);▌t(Scaling Law)的最新修正和月之暗面試圖通過(guò)KVV項(xiàng)目重塑開(kāi)源生態(tài)鏈的深遠(yuǎn)規(guī)劃。

01

長(zhǎng)程執(zhí)行的奇點(diǎn)

盡管詳細(xì)的技術(shù)論文還沒(méi)有發(fā)布,但官方博客中的兩個(gè)數(shù)據(jù)已經(jīng)足以讓技術(shù)圈和商業(yè)界同時(shí)感到震驚:

13個(gè)小時(shí)連續(xù)編碼、300個(gè)子Agent并行協(xié)作。

在過(guò)去的幾個(gè)月中,Agent這個(gè)詞被人口口相傳,仿佛AGI在幾天之后就會(huì)突然實(shí)現(xiàn)。

但現(xiàn)實(shí)是,絕大部分Agent直至目前還只是玩具,或者不太好用的工具。

一旦任務(wù)鏈路被拉長(zhǎng),AI必然陷入記憶衰減或邏輯漂移。對(duì)于一個(gè)業(yè)務(wù)場(chǎng)景復(fù)雜的企業(yè)來(lái)說(shuō),這個(gè)核心痛點(diǎn)直接制約了Agent的實(shí)際落地。

然而,Kimi K2.6實(shí)現(xiàn)了從任務(wù)到工程的質(zhì)變。

就像這夸張的數(shù)據(jù)給人們帶來(lái)的直觀感受一樣,Kimi K2.6展現(xiàn)出了一種令人難以想象的長(zhǎng)程穩(wěn)定性。

在官方實(shí)測(cè)的一個(gè)極端場(chǎng)景中,K2.6成功在Mac本地下載了Qwen 3.5的一款輕量級(jí)模型,甚至還通過(guò)很冷門(mén)的Zig編程語(yǔ)言實(shí)現(xiàn)并優(yōu)化了推理過(guò)程。

圖片

在超過(guò)4000次工具調(diào)用和12小時(shí)的不間斷運(yùn)行后,K2.6的吞吐量從15 tokens/s直接提升到了恐怖的193 tokens/s。

而在另一個(gè)案例中,K2.6搖身一變成為了專(zhuān)家級(jí)別的系統(tǒng)架構(gòu)師。

在重構(gòu)擁有8年歷史的開(kāi)源金融撮合引擎exchange-core時(shí),它通過(guò)分析CPU火焰圖確定了瓶頸,并精準(zhǔn)地修改了超過(guò)4000行代碼,使得峰值吞吐量飆升了133%。

圖片

在這兩個(gè)典型的應(yīng)用背后隱藏的商業(yè)真相呼之欲出:編程就是目前AI創(chuàng)造價(jià)值最顯著、閉環(huán)最快的行業(yè)。

對(duì)于開(kāi)發(fā)者來(lái)說(shuō),Vibe Coding(氛圍編程)的流行已經(jīng)證明AI的商業(yè)落地必須錨定在具備高頻率、高容錯(cuò)閉環(huán)的場(chǎng)景。

需要人們每一分鐘都盯著運(yùn)行的AI實(shí)習(xí)生終究無(wú)法融入實(shí)際應(yīng)用場(chǎng)景,因此K2.6選擇將自己打造成產(chǎn)品經(jīng)理。

與此同時(shí),AI行業(yè)生產(chǎn)力的定義也在發(fā)生變化:人們只會(huì)為確定性結(jié)果而付費(fèi),而不是花錢(qián)購(gòu)買(mǎi)API的調(diào)用次數(shù)。

這種夸張的執(zhí)行力飛躍,本質(zhì)上來(lái)源于楊植麟兩個(gè)月前在英偉達(dá)GTC大會(huì)上提出的“智能體群”范式。

K2.6的集群架構(gòu)能夠支持300個(gè)子Agent并行完成4000個(gè)協(xié)作步驟,本質(zhì)上就是在模擬人類(lèi)社會(huì)的工業(yè)分工。

一個(gè)Agent只是“數(shù)字牛馬”,但300個(gè)Agent集群就是一個(gè)完全數(shù)字化的大型部門(mén)。

更重要的是,這個(gè)大型部門(mén)并不局限于單一領(lǐng)域,它可以針對(duì)全球100個(gè)半導(dǎo)體標(biāo)的執(zhí)行量化策略,可以匹配100個(gè)職位并完全定制簡(jiǎn)歷,甚至能將一篇高質(zhì)量天體物理論文轉(zhuǎn)化為具體的學(xué)術(shù)技能、圖表和結(jié)構(gòu)化數(shù)據(jù)集。

這種組織帶寬的擴(kuò)張,恰好印證了為什么開(kāi)發(fā)者是目前全社會(huì)對(duì)AI付費(fèi)意愿最強(qiáng)的群體。

對(duì)于分散的個(gè)體C端用戶(hù)來(lái)說(shuō),改變固有的“免費(fèi)工具”印象并產(chǎn)生付費(fèi)訂閱是全球AI企業(yè)都不得不面對(duì)的難題。

但對(duì)于集群的B端企業(yè)開(kāi)發(fā)者來(lái)說(shuō),這種能并行處理海量輸入、大規(guī)模執(zhí)行操作的Agent集群是實(shí)打?qū)嵉纳a(chǎn)力工具。

當(dāng)K2.6以這種龐大的規(guī)模開(kāi)始進(jìn)行流水線(xiàn)作業(yè)時(shí),它就已經(jīng)完成了從智力展示到生產(chǎn)經(jīng)濟(jì)價(jià)值的躍遷。

02 

用邏輯打破算力壟斷

如此恐怖的長(zhǎng)程執(zhí)行和Agent并發(fā)能力,不由得讓所有人好奇月之暗面究竟是如何實(shí)現(xiàn)這一奇跡的。

而答案,并非堆砌了無(wú)數(shù)顯卡,而是底層基建的一次效率革命。

就在5天前,月之暗面與清華大學(xué)聯(lián)手發(fā)布了一篇論文,名為《Prefill-as-a-Service: KVCache of Next-Generation Models Could Go Cross-Datacenter》。

“跑得快還省算力”的秘訣,就藏在這篇論文之中:混合注意力架構(gòu)與KVCache的深度壓縮。

底層架構(gòu)上的突破也直接回應(yīng)了AI行業(yè)內(nèi)一個(gè)看似矛盾的現(xiàn)象。

過(guò)去的兩個(gè)月中,以O(shè)penClaw為代表的桌面代理偽需求狂潮逐漸落幕。

即便是還在堅(jiān)持使用的人,也不可避免地面臨一個(gè)核心困境:

代理工具因?yàn)樯婕邦l繁的環(huán)境交互和工具調(diào)用,導(dǎo)致其Token消耗速度遠(yuǎn)超常規(guī)使用。

如果代理工具無(wú)法完成高難度的工程任務(wù),其創(chuàng)造的價(jià)值根本無(wú)法覆蓋高昂的算力成本。

然而,在偽需求清空的同時(shí),真需求卻在增加。

國(guó)內(nèi)大廠的Coding Plan價(jià)格不降反升,甚至陸續(xù)取消Lite級(jí)訂閱的新購(gòu)和續(xù)訂,強(qiáng)推Pro和Max級(jí)服務(wù)。

這種趨勢(shì)說(shuō)明,AI公司正在通過(guò)價(jià)格杠桿清退那些“調(diào)戲AI”的邊緣用戶(hù),專(zhuān)注于服務(wù)那些真正用AI發(fā)揮生產(chǎn)力的核心用戶(hù)。

即便如此,像智譜等企業(yè)的訂閱服務(wù)仍然供不應(yīng)求,好不容易搶到購(gòu)買(mǎi)名額的用戶(hù)也反映一到高峰期就會(huì)頻繁限速。

價(jià)格上漲加上供給短缺,核心原因正是算力成本與真實(shí)產(chǎn)出之間的殘酷博弈,而AI公司必須讓Coding Plan等訂閱服務(wù)扭虧為盈。

月之暗面也不例外,Kimi采用的Kimi Linear架構(gòu),通過(guò)數(shù)學(xué)上的改良把KVCache流量壓縮了驚人的13-36倍。這種極致的壓縮讓跨地域傳輸KVCache成為可能,同時(shí)變得廉價(jià)。

而在系統(tǒng)層面,月之暗面順勢(shì)推出了“預(yù)填充即服務(wù)”(Prefill-as-a-Service, PrfaaS)架構(gòu)。

Refer to caption

它打破了傳統(tǒng)推理必須鎖死在昂貴的RDMA網(wǎng)絡(luò)中的物理邊界,利用被壓縮后的KV流量通過(guò)普通的跨中心以太網(wǎng)實(shí)現(xiàn)算力調(diào)度。

“模型壓數(shù)據(jù)+系統(tǒng)跑調(diào)度”的組合使得Kimi能夠用昂貴的H200專(zhuān)門(mén)負(fù)責(zé)預(yù)填充階段的理解,而讓便宜的顯卡在本地運(yùn)行負(fù)責(zé)解碼生成。

這不僅符合工程美學(xué),還讓月之暗面在高價(jià)訂閱的時(shí)代,通過(guò)底層基建的降維打擊為自己贏得了利潤(rùn)空間。

伴隨節(jié)約成本而來(lái)的,還有智能上限的突破。

楊植麟曾經(jīng)說(shuō)過(guò),Token效率不僅僅是工程問(wèn)題,還關(guān)乎智力上限。

通過(guò)Muon優(yōu)化器,Kimi系列模型在相同的訓(xùn)練量下實(shí)現(xiàn)了2倍的效率提升,并在1萬(wàn)億參數(shù)規(guī)模上解決了訓(xùn)練不穩(wěn)定的難題。

因此,月之暗面已經(jīng)向世界證明,通過(guò)底層架構(gòu)的改良可以實(shí)現(xiàn)token消耗戰(zhàn)中的降本增效。

03 

信任鏈的重塑

在K2.6的技術(shù)博客中,還有一個(gè)容易被忽略但十分有趣的事情,那就是月之暗面在開(kāi)源模型的同時(shí),還開(kāi)源了KVV(Kimi Vendor Verifier)驗(yàn)證項(xiàng)目。

看似有些多管閑事的舉動(dòng),實(shí)則折射出大模型進(jìn)入B端交付時(shí)代的必然選擇。

既然AI行業(yè)已經(jīng)普遍意識(shí)到最核心的受眾始終是開(kāi)發(fā)者,那么可靠性就一定會(huì)成為比智商更重要的準(zhǔn)入門(mén)檻。

在現(xiàn)有的開(kāi)源模型生態(tài)中,AI企業(yè)公布模型權(quán)重只是第一步。

然而,這些開(kāi)源權(quán)重被第三方云供應(yīng)商部署時(shí),往往會(huì)出于對(duì)節(jié)省成本等各種因素的考量,將模型參數(shù)進(jìn)行調(diào)整。

如果參數(shù)設(shè)置不當(dāng),就很容易產(chǎn)生各種網(wǎng)購(gòu)平臺(tái)上“買(mǎi)家秀”和“賣(mài)家秀”的顯著差異。

對(duì)于較高付費(fèi)意愿、極低錯(cuò)誤容忍度的開(kāi)發(fā)者群體來(lái)說(shuō),性能上的折損是致命的。

如果用戶(hù)無(wú)法分清到底是“模型不行”還是“部署不行”,開(kāi)源生態(tài)的品牌信任就會(huì)轟然倒塌。

KVV的推出,正是月之暗面試圖通過(guò)“立法”來(lái)確立行業(yè)規(guī)則的一次嘗試。

這項(xiàng)評(píng)測(cè)標(biāo)準(zhǔn)包含OCRBench視覺(jué)測(cè)試、AIME2025長(zhǎng)輸出壓力測(cè)試、SWEBench軟件工程測(cè)試等六大維度,而月之暗面強(qiáng)制所有接入K2.6的服務(wù)商都必須符合官方的參數(shù)標(biāo)準(zhǔn)。

換句話(huà)說(shuō),KVV驗(yàn)證,就是大模型行業(yè)的ISO 9001質(zhì)量控制和Intel Inside的認(rèn)證體系。

因此,稱(chēng)之為一次極具洞察力的商業(yè)陽(yáng)謀也不為過(guò)。

月之暗面已經(jīng)意識(shí)到,國(guó)產(chǎn)AI路線(xiàn)目前最多也只能效仿Anthropic走專(zhuān)注于編程的垂直賽道,無(wú)法在C端創(chuàng)造出更多的奇跡。

而為了贏得B端開(kāi)發(fā)者的信任,就必須建立起一套透明、可追溯的信任鏈。

想賺Kimi生態(tài)的錢(qián)?那就必須在KVV的審查下保持100%誠(chéng)實(shí)。

而通過(guò)這種方式,月之暗面就不再只是一個(gè)技術(shù)的提供方,而是AI生態(tài)環(huán)境和標(biāo)準(zhǔn)的制定者。

這種權(quán)力邏輯的轉(zhuǎn)變,恐怕遠(yuǎn)比技術(shù)突破更值得深思。

04 

通往社會(huì)操作系統(tǒng)的鑰匙

在官方博客的最后,還提到了一個(gè)正在內(nèi)測(cè)的服務(wù):Claw群組。

如果說(shuō)K2.6是引擎,KVV是標(biāo)準(zhǔn),那么Claw群組就是月之暗面未來(lái)藍(lán)圖上的組織原型:

一個(gè)人類(lèi)、異構(gòu)Agent和跨平臺(tái)工具共生的協(xié)同空間。

官方給K2.6的定義很明確,它將作為一個(gè)協(xié)調(diào)者,能接入來(lái)自任何設(shè)備、任何模型的Agent,并根據(jù)其技能畫(huà)像來(lái)動(dòng)態(tài)匹配任務(wù)。

事實(shí)上,這才是Vibe Coding理想中的形態(tài)。

在一個(gè)協(xié)同的群組中,開(kāi)發(fā)者只需要定義目標(biāo)和氛圍,剩下的復(fù)雜步驟由數(shù)百個(gè)攜帶不同專(zhuān)業(yè)工具的Agent自動(dòng)分工完成。

這也是楊植麟此前在GTC演講結(jié)尾提出的愿景。

回顧K2.6這次深夜發(fā)布,邏輯鏈路已經(jīng)清晰可見(jiàn):

通過(guò)長(zhǎng)程執(zhí)行解決“能不能干活”;

通過(guò)混合注意力架構(gòu)解決“干活成本貴不貴”;

通過(guò)KVV解決“交付標(biāo)準(zhǔn)靠不靠譜”;

通過(guò)Claw群組解決“如何和人類(lèi)一起干活”。

相比于國(guó)內(nèi)互聯(lián)網(wǎng)大廠,月之暗面在AI領(lǐng)域的起步顯然較晚,但其野心卻從未止步于做一個(gè)最好用的大語(yǔ)言模型。

面對(duì)全球范圍內(nèi)的模型性能分水嶺和國(guó)內(nèi)激烈的價(jià)格競(jìng)爭(zhēng),月之暗面選擇了一條最務(wù)實(shí)的道路:

在追趕國(guó)際先進(jìn)模型的同時(shí),專(zhuān)注于B端開(kāi)發(fā)者場(chǎng)景,并通過(guò)底層架構(gòu)的壓榨和信任標(biāo)準(zhǔn)的建立,構(gòu)建一套完整的AI社會(huì)操作系統(tǒng)。

而Kimi系列模型的目標(biāo),就是成為那個(gè)定義規(guī)則、管理集群、實(shí)現(xiàn)指數(shù)級(jí)效率躍遷的決策者。

這場(chǎng)起步于追趕的下半場(chǎng)比賽,必將落腳于關(guān)于執(zhí)行和信任的底層效率戰(zhàn)爭(zhēng)。

       原文標(biāo)題 : Kimi K2.6:大模型進(jìn)入“長(zhǎng)程執(zhí)行”時(shí)代

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)