訂閱
糾錯
加入自媒體

不能只算token賬

2026-04-07 16:40
象先志
關(guān)注

1

Anthropic禁止訂閱用戶通過龍蝦等第三方工具接入后,小米大模型團隊負責人羅福莉凌晨發(fā)了篇帖子討論這事。

主要內(nèi)容可以概括為兩點。

第一,A社的做法雖然會短期推高使用成本,如果用戶繼續(xù)使用Claude模型,但長期來看會帶來很好的工程紀律。

工程紀律的意思是,社區(qū)會因為模型成本上升,在開發(fā)產(chǎn)品時做更合理的工程優(yōu)化來提升token的使用效率。

這里她點名批評了龍蝦,上下文管理做得很拉胯,一個用戶請求會觸發(fā)多輪工具調(diào)用,每次都是攜帶長上下文的獨立API請求。

第二,她呼吁模型廠商不要打價格戰(zhàn),不要靠低價吸引用戶入坑后,又用縮水的模型和不穩(wěn)定的服務(wù)去損害體驗。

我們前兩天寫了篇文章,《小米這次也沒把價格打下來》,其中提到MiMo Token Plan目前價格相對其他廠商同等套餐偏貴。

羅福莉沒有直接承認這點,但間接回答了這個問題:小米的目標是“長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù) —— 而不是讓你沖動付款,然后棄船。”

我們之前文章里提到,MiMo套餐偏貴的事實其實跟小米給大眾的主流印象是有差距的,畢竟觀眾更熟悉性價比敘事。

但這也不是小米搞AI后就變了,小米這個定價肯定也談不上賺錢,只是在其他選手虧損搞token傾銷的時候,選擇了更貼近成本的定價策略。

token傾銷這個詞可能有點重,因為要是以低于成本售賣AI服務(wù)這個標準看,目前行業(yè)里基本沒誰能逃得過。

但有些玩家定價的確相當激進,低價吸引用戶過來后保證不了體驗,比如我就遇到過某家套餐服務(wù)卡頓甚至不可用的情況。

大模型跟其他傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品不同。傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品邊際成本可以不計,用戶翻倍成本增加很少。大模型產(chǎn)品成本跟用戶規(guī)模比例擴張。

而且還因為是非標品,廠商很容易在背后做手腳,稍微降點智用戶不容易察覺,察覺到也沒有實際證據(jù)。

當然,即便存在這些一些問題,我仍然認為模型廠商價格戰(zhàn)是利大于弊的,是雙贏的局面。

用戶客觀上因為價格戰(zhàn)得到了便宜,這是加速新技術(shù)采納的決定性因素。

DeepSeek去年的模型并沒有在能力上超過GPT或者Claude,但R1的意義仍然沒有被高估,因為把成本降低幾十倍對技術(shù)普及的促進必然強于某個增量SOTA模型。

至于虧錢賣token不可持續(xù),我只能說不是現(xiàn)階段二線廠商配考慮的問題。

Anthropic模型能力頂尖,產(chǎn)品體驗差異化,所以哪怕經(jīng)常封號拔網(wǎng)線也一堆用戶求著交錢。

彭博上個月報道,Anthropic當時年化收入已經(jīng)達到200億美元,相比去年底翻倍還多,這個夸張的增長速度隱隱有取OpenAI而代之的意思了。

但二線廠商之間模型能力并沒有拉開差距,不同廠商輪流領(lǐng)先,性價比是不得不走的路子。

羅福莉評價是對的,龍蝦就是vibe coding出來的一堆屎山。

因為是屎山,所以它沒有架構(gòu)設(shè)計,沒有工程優(yōu)化,天生就浪費效率。

但它能火起來,能讓一堆專業(yè)的非專業(yè)的用戶愿意用,就已經(jīng)算是功德無量了。

所有二線廠商都應(yīng)該給龍蝦磕一個,我很難想象沒有龍蝦他們得多努力才能證明自己的價值。

這是OpenRouter上不同模型的使用統(tǒng)計。

在龍蝦火爆之前,你在這個排行里根本看不到二線模型廠商,除了硅谷御四家,其余全是others。

但現(xiàn)在排行榜前幾名,已經(jīng)被阿里、小米、階躍星辰的模型占滿了。

話說新模型出來,免費放OpenRouter上吸引大家用一用,已經(jīng)成為國內(nèi)廠商的慣例。OpenRouter現(xiàn)在已經(jīng)淪為PR前沿陣地。

這兩天阿里發(fā)布Qwen3.6,宣傳登上OpenRouter排行榜首。小米MiMo之前也宣傳登頂了OpenRouter。都是免費試用。

某種程度上說,龍蝦耗token甚至可以理解成是feature。

大模型研發(fā)門檻很高,但大模型供給一直以來都是不稀缺的,因為用戶不需要那么多模型。龍蝦把性價比放大成了真正的競爭力。

簡單拉下數(shù)據(jù)。MiniMax去年總收入7900萬美元,龍蝦爆火后2月ARR已超1.5億美元。月之暗面發(fā)布K2.5模型后,不到20天收入超去年全年,且海外收入首次超過國內(nèi)。

AI的確在推動各個產(chǎn)業(yè)發(fā)生變革,不過就AI自身而言,至今為止都還沒有跑通獨立的盈利模式。OpenAI和Anthropic收入在快速增長,但能否覆蓋巨額研發(fā)和資本支出仍有疑問。

至于智譜、MiniMax和月之暗面?zhèn)儯嚯x閉環(huán)的商業(yè)模式就更為遙遠了。

這種情況下,敘事成為生存的要義。敘事不能只靠畫餅,模型廠商的第一性原理就是模型得有人用。

沒人用,敘事就崩塌了。有人用,越來越多人用,敘事才會變得圓滿。

去年底,月之暗面估值43億美元,現(xiàn)在正以180億美元尋求融資,翻了四倍不止。智譜今天收盤780港幣,是1月份IPO發(fā)行價116港幣的6.7倍。MiniMax的IPO發(fā)行價是165港幣,現(xiàn)在股價是950,也是翻了快6倍。

不能只算token賬。

2

二線模型廠商在成本和規(guī)模壓力下,已經(jīng)有提價動作。但這暫時不會達到擺脫價格戰(zhàn)的地步。

小米的處境比較特殊,它有自己完整的產(chǎn)品矩陣和硬件生態(tài),MiMo的第一使命是融入并改造這個現(xiàn)有生態(tài)。哪怕不對外賣token,小愛同學、智能手機、小米汽車、IoT設(shè)備生態(tài),MiMo都能有大有作為的空間。

智譜、MiniMax、月之暗面?zhèn)儎t處在另一個處境。它們有C端產(chǎn)品,但這個賽道競爭極其慘烈。目前看來獨立的AI產(chǎn)品,無論是通用助手,還是細分賽道,字節(jié)、騰訊和阿里都有碾壓性的優(yōu)勢,也有爭奪的意志。

相較之下,API賣token的生意看起來好一些,雖然好得有限。因為這只關(guān)乎模型質(zhì)量,而騰訊和Meta的經(jīng)驗表明,模型研發(fā)不只是錢和資源的因素。

但龍蝦窗口期不會無限延續(xù)。

如果龍蝦只是一陣風,過段時間隨風而逝,那自然二線廠商也就不能指望這個出貨渠道了。

如果龍蝦代表的不是一個工具的短暫流行,而是C端AI產(chǎn)品的一種范式,那大科技公司一定會出手。

這些公司有流量、有分發(fā)、有用戶信任,它們會以自己的競品收割市場,并且會優(yōu)先使用自己訓練的模型,而不是采購二線廠商的API。

模型跟產(chǎn)品的結(jié)合是大趨勢。阿里打通千問App跟通義模型研發(fā)團隊,搞出了組織調(diào)整和人事出走風波。姚順雨入職騰訊,也是首先做團隊整合,不同研發(fā)部門之間的整合以及研發(fā)跟產(chǎn)品的整合。

羅福莉批評龍蝦耗token,提到Claude Code更節(jié)省上下文的工程設(shè)計,這是另一個產(chǎn)品需要跟模型打通的案例。

龍蝦架構(gòu)上的天然缺陷,意味著每次工具調(diào)用都攜帶完整的長上下文發(fā)起獨立請求,用戶的一個操作可能在后臺觸發(fā)十幾輪API調(diào)用。這不僅燒token,也制造延遲,制造不穩(wěn)定。

Claude Code對上下文做精細管理,知道什么時候該壓縮歷史,什么時候該截斷,怎么在保留任務(wù)狀態(tài)的同時減少冗余信息的傳遞。

這背后是Anthropic對自己模型能力邊界的深刻理解。只有模型研發(fā)者,才能把產(chǎn)品和模型調(diào)優(yōu)成渾然一體的東西。

AI產(chǎn)品的第一代范式是,模型作為通用API,產(chǎn)品套在外面。這個范式催生了龍蝦,也催生了無數(shù)套殼應(yīng)用。它降低了創(chuàng)業(yè)門檻,但也帶來了巨大的效率浪費。產(chǎn)品不理解模型,模型不適配產(chǎn)品,兩邊都在用蠻力彌補彼此的信息差。

如今第二代范式正在浮現(xiàn):模型與產(chǎn)品深度整合,從架構(gòu)層面共同設(shè)計。Claude Code是一個樣本:模型不再是被調(diào)用的服務(wù),而是產(chǎn)品本身的一部分。

這個趨勢下,純粹的模型API廠商面臨的壓力會越來越大,沒有產(chǎn)品可能成為它們的致命缺陷。如果競爭力來自模型與應(yīng)用層的深度整合,那API層的價格競爭就是一場慢性消耗。

行業(yè)一直喜歡說模型即產(chǎn)品,用這句話強調(diào)模型的基礎(chǔ)作用和重要性沒問題。但除非你的商業(yè)模式是只賣API,否則模型始終是產(chǎn)品的組成部分,而不是產(chǎn)品的全部。

       原文標題 : 不能只算token賬

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號