訂閱
糾錯
加入自媒體

Token調(diào)用量大爆發(fā),AI云成了一門好生意

作者|林易編輯|重點君

剛過去的三月份,AI行業(yè)最熱的詞屬于Token(詞元)。幾件事情幾乎同時發(fā)生:

國內(nèi),國家數(shù)據(jù)局局長劉烈宏在中國發(fā)展高層論壇宣布:中國日均Token調(diào)用量已突破140萬億,較兩年前的1000億暴增千倍。

海外,英偉達(dá)創(chuàng)始人黃仁勛在GTC大會上說:Token將是未來數(shù)字世界最核心、最值錢的大宗商品,Token的吞吐量將成為全球企業(yè)CEO追蹤的核心經(jīng)營數(shù)據(jù)。

同樣在三月,阿里云在財報電話會上公布了一個非常激進(jìn)的目標(biāo):五年內(nèi)云與AI商業(yè)化年收入突破1000億美元,隱含年復(fù)合增長率約47%。此外,字節(jié)跳動云計算業(yè)務(wù)火山引擎的豆包大模型日均調(diào)用量超過100萬億Tokens,躋身全球前三。

云計算作為AI時代的底層基礎(chǔ)設(shè)置,重要性越來越高,而AI云正成為一門真正的好生意。

什么是好生意?在科技行業(yè),標(biāo)準(zhǔn)基本可以概括為三條指標(biāo):規(guī)模效應(yīng)帶來的邊際成本遞減、客戶生態(tài)鎖定帶來的高轉(zhuǎn)換成本,以及建立在標(biāo)準(zhǔn)化產(chǎn)品之上的高毛利率與經(jīng)常性收入。

這三條,亞馬遜AWS、微軟Azure、谷歌Cloud幾乎同時滿足。它們通過提供標(biāo)準(zhǔn)化的IaaS、PaaS、SaaS,構(gòu)建了高壁壘、高利潤的商業(yè)閉環(huán):資源池越大成本越低,客戶一旦遷入就難以離開,軟件訂閱則持續(xù)產(chǎn)生高毛利現(xiàn)金流。2025自然年,這三家云廠商的利潤分別高達(dá)456億、540億和139.1 億美元。

但中國云計算卻走上了一條截然不同的路。過去十幾年,盡管市場大盤不斷擴大,但國內(nèi)云廠商長期陷入了重資產(chǎn)、低毛利、高度內(nèi)卷的集成商困境,利潤卻始終做不上去。背后原因在于特殊的IT消費習(xí)慣、貧弱的SaaS生態(tài),以及大型政企客戶對高度定制化的偏好。傳統(tǒng)IaaS階段,由于各家云廠商提供的計算、存儲和網(wǎng)絡(luò)資源高度同質(zhì)化,市場競爭最終往往淪為價格戰(zhàn)。為了爭奪非互聯(lián)網(wǎng)行業(yè)的政企大客戶,云廠商做了大量低毛利、高人力的定制化開發(fā)與本地部署工作,這使得云計算從一種本應(yīng)具備高度規(guī)模效應(yīng)的輕量化服務(wù),變?yōu)榱艘匀肆陀布哑鰹橹鞯膫鹘y(tǒng)IT項目制生意。

直到這一輪AI浪潮,為國內(nèi)云計算廠商帶來了重構(gòu)商業(yè)模式的機會:將大模型封裝成可調(diào)用、可計費的標(biāo)準(zhǔn)化云服務(wù),賣給企業(yè)與開發(fā)者,成為新的增長引擎。

從價格戰(zhàn)到漲價潮

AI首先推動了云計算行業(yè)的結(jié)構(gòu)性增長。2025年第一季度,中國云基礎(chǔ)設(shè)施服務(wù)支出達(dá)116億美元,同比增長16%,AI相關(guān)需求已成為推動企業(yè)向云端遷移的主要動力。另據(jù)Omdia報告,2025年中國AI云市場規(guī)模預(yù)計達(dá)518億元,同比增長148%,到2030年將突破1930億元。(注:各家云廠商對AI云的定義有所不同)

但增長背后曾是慘烈的價格戰(zhàn)。2024年5月,火山引擎旗下豆包大模型在國內(nèi)率先掀起大模型的降級潮,此后,阿里云、百度智能云等相繼跟進(jìn),大模型Token定價在不到一年內(nèi)狂降超90%,部分云廠商的推理算力毛利率跌為負(fù)數(shù)。他們策略是“以虧損換規(guī)模”,畢竟誰能先在開發(fā)者和企業(yè)客戶中建立起API調(diào)用習(xí)慣,誰就能在未來占據(jù)主動。

直到2026年初,價格戰(zhàn)信號才開始逆轉(zhuǎn)。海外,亞馬遜AWS與谷歌Cloud先后宣布漲價,國內(nèi),阿里云、百度智能云、騰訊云隨即跟進(jìn)。3月18日阿里云和百度智能云同步官宣漲價,其中:

阿里云最高漲34%:對AI算力、存儲等產(chǎn)品進(jìn)行調(diào)價。其中,采用自研芯片的平頭哥真武810E等算力卡產(chǎn)品上漲5%-34%;滿足高性能計算的文件存儲產(chǎn)品CPFS上漲30%。新價格于2026年4月18日起執(zhí)行。

百度智能云最高漲30%:AI算力相關(guān)產(chǎn)品服務(wù)上調(diào)約5%-30%;并行文件存儲等上調(diào)約30%。同樣于2026年4月18日起生效。

漲價最直接的導(dǎo)火索就是激增的Token需求。單純的大模型對話帶來的Token消耗有限,而2026年Agent爆發(fā)和多模態(tài)模型成熟徹底擴容了AI云市場。尤其是Claude Code、OpenClaw等智能體產(chǎn)品的走紅,讓科技公司意識到,一次智能體任務(wù)往往包含多輪內(nèi)部推理、工具調(diào)用和任務(wù)執(zhí)行,其Token消耗量通常顯著高于普通的AI對話。算力需求從“云端訓(xùn)練”徹底轉(zhuǎn)變?yōu)椤坝?xùn)練+推理”雙輪驅(qū)動,導(dǎo)致現(xiàn)有AI算力資源極度緊缺。

正是這種算力供需關(guān)系的變化,直接催生了商業(yè)計費模式的改變。

從IaaS算力租賃到MaaS Token經(jīng)濟學(xué)

在傳統(tǒng)的IaaS階段,云廠商的核心商業(yè)模式是作為“二房東”,出租底層計算資源、存儲空間和網(wǎng)絡(luò)帶寬,同質(zhì)化嚴(yán)重。

Token出現(xiàn)打破了這一局面。Token是AI模型處理語言、圖像、音視頻的最小語義單元,用戶每次與大模型交互,最終都被拆解成Token完成運算。以Token計費,云廠商從"賣硬件使用權(quán)"轉(zhuǎn)變成了"賣智能服務(wù)"。

這套模式有優(yōu)勢非常明顯:首先是抹平了硬件同質(zhì)化。用戶不再關(guān)心底層是什么GPU,只關(guān)心同等Token能否完成任務(wù);其次是天然放大了規(guī)模效應(yīng)。算力池越大,并發(fā)調(diào)度效率越高,分?jǐn)偟矫總Token的邊際成本越低;最后是標(biāo)準(zhǔn)化API接口形成了生態(tài)鎖定,調(diào)用習(xí)慣一旦建立,遷移成本極高。云服務(wù)真正變成了像水電一樣,打開即用,接上即跑。

云廠商也正在將緊缺的AI算力資源向高附加值的Token業(yè)務(wù)傾斜。比如,騰訊云在過去一個多月快速整合資源,推出了覆蓋云端、C端及企業(yè)版的“龍蝦”產(chǎn)品矩陣,并直接將原有的MaaS大模型服務(wù)平臺升級為TokenHub,推出統(tǒng)一的Token Plan服務(wù)。

智能體的普及使得原本按次調(diào)用的能力變成了高頻、自動化的服務(wù),極大地推高了云廠商的Token流水,也讓MaaS業(yè)務(wù)有望在未來占到云廠商整體收入的30%甚至更高。

據(jù)《財經(jīng)雜志》報道,2025年12月末,阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光在一場小規(guī)模溝通中稱,MaaS收入在云廠商整體收入的占比,有可能達(dá)到30%甚至更高。此外,亞馬遜AWS管理層在2025年三季度財報電話會議上也曾披露,要把Bedrock打造成全球最大的推理平臺,收入貢獻(xiàn)將與其核心計算產(chǎn)品EC2不相上下,預(yù)計在總營收中占比超過30%。

而這正是頂級云生意所需要的"經(jīng)常性、高毛利、可復(fù)制"的收入結(jié)構(gòu)。

AI云的勝負(fù)手是全棧成本的競爭

模式雖好,但AI云的競爭正變得日趨激烈。

海外,轉(zhuǎn)型AI云,成為亞馬遜AWS、微軟Azure、谷歌Cloud、甲骨文OCI的共同目標(biāo);國內(nèi),阿里云、百度智能云、騰訊云、火山引擎、華為云等科技云廠商,也紛紛強化自己的AI屬性。各家云廠商的資本開支,也持續(xù)創(chuàng)新高。

在我們看來,AI云的競爭不是單純的算力競爭,而是全棧成本的競爭。勝負(fù)手不在于誰的GPU更多,而在于誰能實現(xiàn)最低的"單位Token成本"。

美國四大云廠商的競爭已經(jīng)驗證了這個邏輯。谷歌是全棧整合程度最高的玩家,Gemini系列模型由自研TPU訓(xùn)練、部署在TPU上,芯片、模型、云服務(wù)三位一體,同時掌握成本控制權(quán)與定價權(quán)。亞馬遜累計交付超140萬枚自研Trainium 2芯片,性價比比同類英偉達(dá)GPU高30%-40%。反面教材案例甲骨文,無自研芯片,算力建設(shè)完全依賴英偉達(dá),資本支出超過自身經(jīng)營性現(xiàn)金流,同時高度依賴OpenAI單一客戶,處境最為脆弱。

中國云廠商面臨同樣的競爭邏輯,疊加地緣壓力,維度更為復(fù)雜。

阿里云擁有規(guī)模與全棧的雙重優(yōu)勢,護城河最深。百煉MaaS平臺聚合通義千問、DeepSeek等數(shù)十款主流模型;已累計向?qū)嶋H業(yè)務(wù)部署出貨超過47萬顆AI芯片,60%以上服務(wù)于外部商業(yè)化客戶。未來三年,阿里宣布將投入超3800億元用于云和AI基礎(chǔ)設(shè)施建設(shè)。

百度智能云不急于搶Token流量規(guī)模,而是向能源、金融、汽車等垂直行業(yè)的核心流程深度滲透,憑借自研芯片昆侖芯、文心大模型與千帆平臺的"芯-云-模-體"全棧自研體系,連續(xù)兩年拿下國內(nèi)大模型招投標(biāo)項目數(shù)和中標(biāo)金額雙料第一。

火山引擎走的是激進(jìn)的MaaS優(yōu)先路線。字節(jié)跳動內(nèi)部抖音、視頻創(chuàng)作、Seedance視頻生成模型等龐大的應(yīng)用生態(tài),平攤了基礎(chǔ)設(shè)施固定成本,讓火山引擎在Token價格上得以持續(xù)激進(jìn)定價。據(jù)《晚點》報道,火山引擎此前曾定下了2026年MaaS業(yè)務(wù)收入超百億元的目標(biāo),隨著Seed 2.0、Seedance 2.0 等模型發(fā)布、OpenClaw持續(xù)爆火,團隊已提升了收入目標(biāo)。

騰訊云過去幾年實現(xiàn)艱難轉(zhuǎn)型。2022年前后,騰訊云主動砍掉低毛利總包業(yè)務(wù),聚焦高毛利自研PaaS/SaaS產(chǎn)品,將"被集成"而非"總集成"樹立為核心戰(zhàn)略。短期市場份額承壓,但改善收入結(jié)構(gòu):2025年IaaS占四成、PaaS占四成、SaaS占兩成,而PaaS與SaaS的毛利率維持在50%-70%,遠(yuǎn)高于IaaS的10%-15%。成立12年后,首次實現(xiàn)規(guī);,馬化騰在財報中將其列為當(dāng)年核心成就。

生成Token的成本與效率決定一切

AI將云計算的計費單元從同質(zhì)化的算力資源轉(zhuǎn)向差異化的智能服務(wù);Token的爆炸式增長,使MaaS層收入很長一段時間內(nèi)看不到天花板;標(biāo)準(zhǔn)化API帶來的規(guī)模效應(yīng)與生態(tài)鎖定,正在賦予頭部云廠商一定程度的定價權(quán)。

AI讓云計算的生意模式變好了,但機會注定只屬于少數(shù)玩家:有充裕的現(xiàn)金流,能承受千億級算力軍備投入;能自研芯片或深度國產(chǎn)算力整合能力,在英偉達(dá)生態(tài)之外構(gòu)建成本控制能力;以及有自研模型和MaaS工程化落地能力,因為模型強弱直接決定單卡Token吞吐量,決定單Token成本,最終決定毛利率。

正如黃仁勛所說:生成Token的成本與效率,決定科技企業(yè)的營收與生死。

       原文標(biāo)題 : Token調(diào)用量大爆發(fā),AI云成了一門好生意

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號