訂閱
糾錯(cuò)
加入自媒體

Kimi、Minimax 們的算力荒:智能白菜價(jià),你買不到

2026-03-27 10:57
象先志
關(guān)注

本地蝦風(fēng)險(xiǎn)還是有點(diǎn)大,各家也上線了各種云端蝦。

Kimi出了K2.5,我第一時(shí)間開(kāi)了Allegretto 套餐,199元/月的套餐,布局 KimiClaw 的最低配套餐,想試試Agent集群到底有多能打。MiniMax的Coding Plan也試了。

結(jié)果呢?Kimi隔三差五跳出“高峰時(shí)段算力不足”的提示,Agent任務(wù)跑到一半斷掉是家常便飯。MiniMax那邊更離譜,龍蝦部署上去,聊兩句就掉線,API動(dòng)不動(dòng)返回限速警告。

199塊買了一張算力排隊(duì)票。

翻了翻用戶群,吐槽聲不絕于耳,一個(gè)MiniMax用戶@客服:“今天已經(jīng)連續(xù)掉線了,聊2句就掉了。”客服回復(fù):建議您檢查本地網(wǎng)絡(luò)。另一個(gè)人貼出終端截圖,MiniMax API返回rate_limit_error,配圖是一張“賽博牛馬”的表情包:大哥,我就一個(gè)蝦,隔了5分鐘發(fā)了條消息,給我限速了。

小紅書上也是,基本都是勸下車的。

簡(jiǎn)單來(lái)說(shuō)就是,你花了錢,但算力不一定是你的。什么時(shí)候能用上,看運(yùn)氣,因?yàn)楦叻鍟r(shí)期限速太嚴(yán)重了。

那邊的 Claude是動(dòng)不動(dòng)就限額,咱們這邊是動(dòng)不動(dòng)就限速。還是能工智人好,run 一天只需要倆饅頭。

不過(guò)算力緊缺這事兒早就不新鮮了,2月10日,Kimi因算力告急宕機(jī),官方回應(yīng)堪稱行為藝術(shù):“嗯,正在找算力。要不先用DeepSeek。”一家融了超20億美元、手握100億現(xiàn)金的公司,在自家產(chǎn)品最火的時(shí)候讓用戶去用競(jìng)品。DeepSeek自己也沒(méi)好到哪去——2月28日、3月5日接連大規(guī)模宕機(jī),服務(wù)器繁忙。

2026年春天,國(guó)產(chǎn)AI集體進(jìn)入了“用不了”時(shí)代。

算力基建,提前兌現(xiàn)

直覺(jué)上,“算力荒”好像是禁令的鍋。這個(gè)有道理,但不精確。

禁令是背景板,DeepSeek和Qwen這些模型本身就在資源約束下設(shè)計(jì),MoE架構(gòu)天然省算力。Kimi總裁張予彤之前在達(dá)沃斯說(shuō)得很直白:僅用美國(guó)頂尖實(shí)驗(yàn)室1%的資源,做出了全球領(lǐng)先的開(kāi)源模型。

真正擊穿基礎(chǔ)設(shè)施的,是Agent。

Chatbot是一問(wèn)一答,算力消耗線性可預(yù)測(cè)。Agent完全不同——一個(gè)任務(wù)背后可能觸發(fā)幾十上百次模型調(diào)用:規(guī)劃、拆解、執(zhí)行、反思、糾錯(cuò),每一步都過(guò)模型。長(zhǎng)上下文持續(xù)占顯存,工具調(diào)用讓GPU空轉(zhuǎn)。

Chatbot時(shí)代GPU就好像餐廳服務(wù)員,一桌客人上完菜就去下一桌。Agent時(shí)代,服務(wù)員全程陪同,從點(diǎn)菜到結(jié)賬,思考菜單的時(shí)候也不能走。同樣數(shù)量的服務(wù)員,能服務(wù)的桌數(shù)斷崖式下降。

粗略計(jì)算的話,Chatbot單輪對(duì)話消耗約1,000到3,000個(gè)token。Agent做一個(gè)完整任務(wù)——比如用龍蝦跑一次深度研究——要經(jīng)歷感知、規(guī)劃、執(zhí)行、反思等多個(gè)循環(huán),中等復(fù)雜度輕松吃掉10萬(wàn)token,復(fù)雜任務(wù)到百萬(wàn)級(jí)。

有開(kāi)發(fā)者報(bào)告單次OpenClaw運(yùn)行燒掉了800萬(wàn)token。再疊加K2.5 Thinking這類推理鏈模型,思考過(guò)程本身的隱藏token能把成本再放大10到30倍。保守估計(jì),從chatbot到Agent,單次任務(wù)算力消耗放大30到100倍,極端場(chǎng)景1,000倍以上。

Deloitte的研究點(diǎn)出了一個(gè)宏觀悖論:過(guò)去兩年token單價(jià)降了280倍,但企業(yè)AI賬單反而飆升——推理成本降了1,000倍,需求增長(zhǎng)了10,000倍。

問(wèn)題是,Kimi和MiniMax自己并不擁有GPU。

從財(cái)報(bào)上看,MiniMax固定資產(chǎn)開(kāi)支都極低,Kimi 雖然還沒(méi)上市但情況也類似,算力幾乎全部來(lái)自第三方云服務(wù)——輕資產(chǎn)模式,跟OpenAI自建數(shù)據(jù)中心完全不同。Kimi背后是火山引擎和阿里云雙軌供應(yīng):火山引擎從2023年起獨(dú)家提供訓(xùn)練和推理方案,后來(lái)阿里投了月之暗面8億美元,其中一部分直接以阿里云算力結(jié)算,楊植麟公開(kāi)給阿里云“代言”。MiniMax更復(fù)雜,阿里云、騰訊云、火山引擎都是它的供應(yīng)商,早期招標(biāo)會(huì)上三家殺到2折競(jìng)價(jià)。

誰(shuí)也沒(méi)想到,隨著龍蝦到來(lái),token 需求的爆發(fā)來(lái)得如此之快。

Agent來(lái)了之后,價(jià)格戰(zhàn)的邏輯跑不通了。“以后”變成了“現(xiàn)在”:未來(lái)緩慢補(bǔ)充基建的時(shí)間瞬間消失。

用戶在罵Kimi卡的時(shí)候,Kimi可能也在罵火山引擎和阿里云卡。算力荒是從芯片到云服務(wù)到模型公司到用戶的四層傳導(dǎo),Kimi和MiniMax站在最下游,承受每一層壓力的疊加。

上游扛得住嗎?

信號(hào)已經(jīng)出現(xiàn)了。今年3月,國(guó)內(nèi)云廠商開(kāi)始集體調(diào)價(jià)——AI算力和存儲(chǔ)產(chǎn)品價(jià)格上漲,漲幅從個(gè)位數(shù)到30%以上不等。優(yōu)刻得直接開(kāi)啟全系漲價(jià)。海外也不例外,AWS和谷歌云在部分產(chǎn)品上試水調(diào)價(jià)。SK海力士公開(kāi)表示2026年存儲(chǔ)芯片持續(xù)漲價(jià)已成定局,DRAM庫(kù)存僅剩約4周。持續(xù)二十年的“云服務(wù)只降不升”鐵律,被AI需求擊穿了。

漲價(jià)的邏輯不復(fù)雜。云廠商們過(guò)去一年瘋狂擴(kuò)建AI算力基礎(chǔ)設(shè)施,資本開(kāi)支動(dòng)輒數(shù)百億量級(jí),但AI業(yè)務(wù)本身的利潤(rùn)率還很薄,遠(yuǎn)不夠覆蓋基建投入。Token調(diào)用量在指數(shù)級(jí)增長(zhǎng)——2026年2月國(guó)內(nèi)主流大模型日均消耗合計(jì)約180萬(wàn)億——但賣Token的收入增速追不上建數(shù)據(jù)中心的花錢速度。漲價(jià),不是云廠商貪心,是供應(yīng)鏈漲價(jià)的無(wú)奈之舉。

更棘手的是設(shè)備折舊。AWS、Google Cloud、Azure三家在2023-2024年統(tǒng)一把服務(wù)器折舊年限從3-4年延長(zhǎng)到了6年,集體節(jié)省了約180億美元的年度折舊開(kāi)支。但NVIDIA的芯片迭代周期只有18-24個(gè)月——你今天花幾千億建的數(shù)據(jù)中心,里面的GPU可能兩年后就不是最優(yōu)選擇了,折舊卻要攤6年。

Satya Nadella自己都說(shuō):“我不想在一代芯片上背四五年的折舊。”

看一眼算力市場(chǎng)的格局。火山引擎憑借豆包以日均63萬(wàn)億Token領(lǐng)跑,拿下公有云大模型調(diào)用量49.2%的份額,幾乎一家占了半壁江山。阿里云日均32萬(wàn)億排第二,騰訊元寶28萬(wàn)億、DeepSeek 22萬(wàn)億緊隨其后。但調(diào)用量第一和營(yíng)收第一不是同一家——按Omdia統(tǒng)計(jì),阿里云以35.8%營(yíng)收份額穩(wěn)居AI云市場(chǎng)第一,超過(guò)第二到第四名總和;鹕节A在“輕”,阿里贏在“重”。

Kimi和MiniMax的算力命脈就握在這兩家手里。MiniMax上市后資本市場(chǎng)對(duì)Token增長(zhǎng)狂熱追捧——M2.5發(fā)布首周調(diào)用量暴漲至3.07萬(wàn)億Token——但每一個(gè)Token背后都是真實(shí)的推理成本。MiniMax 2025年全年?duì)I收不足8000萬(wàn)美元,經(jīng)調(diào)整凈虧損2.5億,毛利率剛爬到25%。上游一漲價(jià),這個(gè)剛轉(zhuǎn)正的毛利隨時(shí)可能被吃掉。

這些問(wèn)題反映到C端,只有一個(gè)結(jié)果:繼續(xù)承受漲價(jià)或限流。Kimi配置最低的Allegretto套餐已經(jīng)199元/月,幾乎和包含Co-work以及Claude Code的Claude Pro同價(jià)了。如果繼續(xù)漲價(jià),我們所說(shuō)的“白菜價(jià)”智能,就真的不存在了。

截至文章發(fā)布前,老虎證券剛剛發(fā)布消息,月之暗面已經(jīng)開(kāi)始考慮赴港上市。那Kimi就需要正面回答這個(gè)問(wèn)題了:是繼續(xù)租算力還是自己買設(shè)備,是保利潤(rùn)率還是保用戶。MiniMax已經(jīng)站在聚光燈下,每一季財(cái)報(bào)都是照妖鏡。Kimi 本來(lái)手握 100 億的賬上資金,至少短期不用受到資本市場(chǎng)的審視,但剛好今天,就傳出了 Kimi 赴港上市的傳聞。

如果傳聞是真的,那么 Kimi和 MiniMax 們真的需要考慮一個(gè)問(wèn)題,到底是保用戶還是保利潤(rùn)率。隨著漲價(jià)鏈條的傳遞,大模型們被“兩頭堵”的可能性,已經(jīng)驟然提升。

寫在最后

2026年,Agent改變了算力的需求曲線。便宜的智能沒(méi)變貴,使用智能的方式變了,資源出現(xiàn)了擠兌。

漲價(jià)什么時(shí)候會(huì)停?短期內(nèi)恐怕看不到。Agent的需求曲線還在陡峭的上升期——Kimi K2.5剛上線不到一個(gè)月,收入就超過(guò)了2025年全年;MiniMax M2.5發(fā)布首周Token消耗量超過(guò)三家競(jìng)品之和。多Agent并行、長(zhǎng)上下文推理、編程場(chǎng)景的爆發(fā)才剛剛開(kāi)始,每一個(gè)新場(chǎng)景打開(kāi)都意味著Token消耗量再上一個(gè)臺(tái)階。而供給側(cè)的擴(kuò)容周期是以年為單位的——數(shù)據(jù)中心從規(guī)劃到投產(chǎn)至少18個(gè)月,芯片禁令下國(guó)產(chǎn)替代的產(chǎn)能爬坡更慢。需求按周增長(zhǎng),供給按年追趕,中間的剪刀差就是漲價(jià)和限流的空間。

更深層的變化是,中國(guó)的云廠商們可能正在被迫進(jìn)入一個(gè)全新的重資產(chǎn)設(shè)備周期。過(guò)去二十年,云計(jì)算的敘事是“輕”——彈性伸縮、按需付費(fèi)、用多少買多少。但Agent時(shí)代的算力需求把這個(gè)敘事翻了過(guò)來(lái)。阿里宣布三年投入3800億建AI基礎(chǔ)設(shè)施,字節(jié)在火山引擎上的算力部署同樣激進(jìn)。這些投入一旦啟動(dòng)就停不下來(lái)——你今天不建,明天的Token就沒(méi)地方跑;但建了之后,折舊攤銷會(huì)在未來(lái)五到十年持續(xù)壓在利潤(rùn)表上。

這很像二十年前電信運(yùn)營(yíng)商鋪3G/4G網(wǎng)絡(luò)的周期:需求爆發(fā)倒逼巨額基建,基建倒逼漲價(jià)或補(bǔ)貼退坡,最終整個(gè)行業(yè)的利潤(rùn)結(jié)構(gòu)被重塑。當(dāng)年中國(guó)移動(dòng)、中國(guó)聯(lián)通經(jīng)歷的資本開(kāi)支競(jìng)賽,今天可能在阿里云、火山引擎身上重演。區(qū)別在于,電信行業(yè)有牌照壁壘和政策保護(hù),云廠商沒(méi)有。

對(duì)于站在鏈條最下游的Kimi和MiniMax們來(lái)說(shuō),這意味著算力成本不會(huì)回到價(jià)格戰(zhàn)時(shí)代的地板價(jià)了。對(duì)于用199元套餐跑龍蝦的你和我來(lái)說(shuō),這意味著“便宜好用的AI”這個(gè)窗口期,可能比所有人想象的都要短。

       原文標(biāo)題 : Kimi、Minimax 們的算力荒:智能白菜價(jià),你買不到

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)