訂閱
糾錯
加入自媒體

告別價格戰(zhàn),大模型共迎通脹時代

2026-04-24 16:59
鋅刻度
關(guān)注

圖片

 價值創(chuàng)造比成本控制更重要

 

撰文陳鄧新

編輯李   季

排版/ Annalee  

眼下,漲價成為大模型的關(guān)鍵詞。 

邁入2026年,大模型不再是優(yōu)惠縮水,而是毫不掩飾地開啟了漲價模式,大大小小的廠商紛紛入局,智普甚至在短短三個月之內(nèi)兩次提價。 

以至于,國產(chǎn)大模型定價首次與海外頭部廠商對齊。 

大模型漲價,是曇花一現(xiàn)還是曠日持久?降價爭奪市場的打法,是否走到了盡頭?價值戰(zhàn)會成為未來競爭的核心敘事嗎?   

不愿賤賣成為行業(yè)的共識

曾幾何時,降價才是大模型的競爭基調(diào)。

“全線降價”“兩款產(chǎn)品免費”“百萬Token一分錢”“比行業(yè)同類產(chǎn)品便宜90%”“免費、全面免費、永久免費”……

這一系列動作的背后,則是大模型為了長遠(yuǎn)發(fā)展選擇犧牲短期利益。 

通俗易懂地說,為了AI普惠需要不斷降低大模型的Token價格,唯有此才可以在B端賦能千行百業(yè)、在C端成為標(biāo)配的日常工具。

 

圖片

Token成為大模型的重中之重 

畢竟,將市場蛋糕越做越大才可以吃到規(guī);募t利,從而獲得更大的勢能。 

阿里云資深專家朱迅垚曾表示:“阿里云大模型降價,是希望讓更多的使用者和中小企業(yè)用上大模型,加速AI應(yīng)用市場的提前爆發(fā)。” 

百度智能云AI與大模型平臺總經(jīng)理忻舟亦表示:“大模型仍處于市場培育階段,企業(yè)只有在認(rèn)識到大模型帶來的巨大價值后,才能將其應(yīng)用于更大規(guī)模、更復(fù)雜的業(yè)務(wù)場景中。” 

需要注意的是,大模型并非一味追求降價,也通過創(chuàng)新進(jìn)行讓利。 

以2025年6月發(fā)布的豆包大模型1.6為例,一改行業(yè)之前的定價慣例:深度思考或多模態(tài)能力無需為Token額外買單,且Token的價格隨著0—32K、32K—128K和128K—256K這三個輸入長度的增長而增加,進(jìn)行了分區(qū)定價,性價比更高。

 

圖片

分區(qū)定價打破常規(guī)

不曾想,大模型價格只降不升的傳統(tǒng)被打破了。

邁入2026年之后,GLM、Seedance、HY2.0 Instruct等大模型或多或少有了提價的動作,特別是GLM-5.1在Coding場景的緩存命中Token價格接近Anthropic旗下大模型Claude Sonnet,這是國產(chǎn)大模型首次在核心場景實現(xiàn)與海外頭部廠商的價格對齊。

這意味著,大模型越來越不愿意賤賣Token了。

MiMo大模型負(fù)責(zé)人羅福莉表示:“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價之前,不要盲目地競相壓低價格。以極低的價格出售Token,同時對第三方敞開大門,這看起來對用戶很有吸引力,但這卻是一個陷阱——Anthropic剛剛擺脫的那個陷阱。”

簡而言之,打價格戰(zhàn)不如打價值戰(zhàn)。 

Token價格低,不意味著模型能力強,如若模型能力不足則會消耗更多的Token,進(jìn)而導(dǎo)致更大的浪費,最終用戶與大模型雙輸。 

如此一來,大模型回歸價值博弈成為一道必答題。 

 

競爭焦點出現(xiàn)了轉(zhuǎn)向

 大模型從價格戰(zhàn)走向價值戰(zhàn),背后的緣由有三。

首先,供不應(yīng)求。

智能體時代,Token的長度從十萬級向百萬級、千萬級躍遷,與此同時消耗量也實現(xiàn)了上百倍增長,成為大模型提高獲客量的關(guān)鍵抓手。 

之所以如此,與思考鏈路延長息息相關(guān)。

一問一答模式的Token消耗是線性增長,而智能體模式可以進(jìn)行長鏈路思考、執(zhí)行多重任務(wù)、完成循環(huán)調(diào)用等,Token消耗是指數(shù)級增長。 

關(guān)于此,從智譜的數(shù)據(jù)就可見一斑。 

2026年第一季度,智譜大模型的API調(diào)用定價提升了83%,而Token消耗量增長了400%,提高定價并未抑制需求,反而出現(xiàn)了供不應(yīng)求的現(xiàn)象。 

智譜CEO張鵬表示:“AGI時代的商業(yè)價值可以歸結(jié)為一個簡潔的公式:智能上界 × Token消耗規(guī)模,智能上界決定了定價權(quán),Token消耗規(guī)模決定了價值體量。未來,衡量一個個體或組織價值的標(biāo)準(zhǔn),不再是掌握了多少信息,而是其作為Token架構(gòu)師,在給定預(yù)算下構(gòu)建復(fù)雜 Agent系統(tǒng)并驅(qū)動大模型完成復(fù)雜Agent系統(tǒng)的自主運行。” 

正因為如此,大模型的競爭焦點出現(xiàn)了轉(zhuǎn)向。 

大模型不再圍繞參數(shù)、數(shù)量、打榜等指標(biāo)比拼,而是轉(zhuǎn)向拼應(yīng)用、拼生態(tài),因而性價比不再是唯一的關(guān)鍵指標(biāo),價值創(chuàng)造站到了C位。 

譬如,混元3D世界模型2.0可以理解文字、圖片、視頻等不同類型的輸入,自動生成3D場景,無縫對接游戲開發(fā)、AI漫劇等工作流。

 

圖片

一句話生成3D世界 

再譬如,GLM-5.1能夠在一次任務(wù)中獨立、持續(xù)工作超過8小時,成為當(dāng)下唯一具備此能力的開源模型。 

其次,分擔(dān)成本。

 大模型落地離不開云計算的鼎力相助,但云計算的成本肉眼可見的在不斷增長,如此漲價成為必然。 

以數(shù)據(jù)中心為例,一方面存儲芯片等成為賣方市場,持續(xù)抬高新建成本;另外一方面由于是耗電大戶,在能源價格高企的背景之下,運營成本被迫不斷抬升。 

不難看出,大模型服務(wù)比傳統(tǒng)的互聯(lián)網(wǎng)服務(wù)成本更貴。 

更為關(guān)鍵的是,由于AI技術(shù)不斷迭代,大模型也需要推陳出新,進(jìn)一步推高了開支,亟須探索良性的、合理的商業(yè)化路徑。 

火山引總裁譚待曾有言:“對于企業(yè)級市場來說,商業(yè)模式是建立在可持續(xù)發(fā)展的基礎(chǔ)上,任何商品必須是盈利的,不能靠補貼來降價。如果降價是虧損的,規(guī)模越大虧得越多,這就不是合理的商業(yè)模式。” 

再次,勝者為王。 

隨著“百模大戰(zhàn)”的演進(jìn),不少實力欠佳的玩家選擇退場,即便是實力強勁的玩家也難以面面俱到,選擇聚焦主航道。 

Sora,就是最好的明證。

作為OpenAI旗下的AI視頻生成工具,Sora誕生之初備受好評,視為AI生成視頻賽道的顛覆性產(chǎn)品。

 卻不想,由于入不敷出,成為OpenAI的棄子。

 

圖片

Sora壽終正寢 

公開數(shù)據(jù)顯示,Sora商用級內(nèi)容的生成命中率僅5%~10%,生成一分鐘高質(zhì)量視頻的推理成本為30~50美元,因而30天用戶留存率為1%,60天留存率為0%。

簡而言之,Sora并沒有成為生產(chǎn)力工具。

其實,Sora不行,不意味著AI生成視頻不行,Seedance、可靈等中國AI生成視頻大模型不但技術(shù)過硬,更是不缺應(yīng)用場景,最終上演了彎道超車。 

“藍(lán)鯨科技”報道:“Seedance 2.0出來前,大多數(shù)模型每次只能生成一個5秒的視頻,5秒里可能3秒都是廢片,一個完整的鏡頭需要幾個視頻拼接,而Seedance 2.0能夠生成完整的15秒視頻,運鏡切換自如。”

Seedance之外,可靈的表現(xiàn)也可圈可點。 

財報數(shù)據(jù)顯示,2025年第一季度至第四季度,可靈的營業(yè)收入分別為1.5億元、2.5億元、3億元、3.4億元,雖然增速有所放緩,但整體依然處于增長的勢態(tài)。 

總而言之,大模型走過了采取低價甚至免費策略進(jìn)行AI普惠的階段,邁入了價值創(chuàng)造的階段,為了更好地釋放生產(chǎn)力,既要比拼模型的高效,也要比拼場景的適配。 

那么,大模型競速進(jìn)入“深水區(qū)”。

       原文標(biāo)題 : 告別價格戰(zhàn),大模型共迎通脹時代

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號