訂閱
糾錯(cuò)
加入自媒體

養(yǎng)蝦人,開始認(rèn)真算賬了

過去兩個(gè)月,OpenClaw這只“龍蝦”紅得發(fā)紫。

連不懂代碼的普通人,都花699塊找上門師傅“裝蝦”,只為體驗(yàn)一把AI替我打工的爽感。

但熱度退得比來得更快。

進(jìn)入4月,當(dāng)你再次搜索“OpenClaw”,前排內(nèi)容不再是教程和贊美,而是“龍蝦退潮了”“太燒token了”這樣的感嘆。

近幾天國(guó)內(nèi)外大廠接連兩記重錘,更是把所有養(yǎng)蝦人拽回現(xiàn)實(shí)。

第一錘來自Anthropic。

4月4日Anthropic突然切斷了通過Claude訂閱使用OpenClaw等第三方Agent。想繼續(xù)用?可以,改走API密鑰,按token實(shí)打?qū)嵏顿M(fèi)。

第二錘來自小米MiMo大模型負(fù)責(zé)人羅福莉。

4月6日,她在X上發(fā)帖直指OpenClaw這類第三方Agent是“Token的虛假狂歡”,痛批它們對(duì)算力的粗放型消耗。

兩條新聞,指向同一個(gè)事實(shí):龍蝦正在制造一個(gè)誰(shuí)也堵不住的token黑洞。

在經(jīng)歷過全民熱潮后,養(yǎng)蝦成本到底多少,成本黑洞能否被解決?

01

昂貴的龍蝦

“月薪兩萬(wàn),養(yǎng)不起一只龍蝦”。

“養(yǎng)蝦一時(shí)爽,賬單火葬場(chǎng)”。

這些流傳最廣的段子,寫出了初代養(yǎng)蝦人的心聲。

一位中小企業(yè)主描述了他的養(yǎng)蝦經(jīng)歷:團(tuán)隊(duì)五個(gè)人共享一個(gè)OpenClaw實(shí)例,設(shè)置自動(dòng)執(zhí)行測(cè)試用例和代碼審查。

第一個(gè)月結(jié)束時(shí),他們預(yù)期的成本是100美元,實(shí)際賬單卻接近800美元。

“最恐怖的是,你根本不知道錢是怎么花掉的”,他在社交平臺(tái)分享,“就像家里有個(gè)看不見的水龍頭在一直滴水”。

這并不是個(gè)例,因?yàn)镺penClaw的賬單具有極強(qiáng)的欺騙性。

當(dāng)你向OpenClaw發(fā)送一條簡(jiǎn)單的指令,比如“幫我優(yōu)化這段代碼”,你以為自己在進(jìn)行一次API調(diào)用,但實(shí)際上,在后臺(tái)可能觸發(fā)了多次獨(dú)立的模型請(qǐng)求:

第一次是解析意圖,第二次是生成任務(wù)步驟,第三次是調(diào)用工具分析代碼,第四次是生成回復(fù),第五次是為對(duì)話生成標(biāo)題和標(biāo)簽,甚至再推薦幾個(gè)可能的追問建議。

用戶只看到一次回復(fù),但賬單卻在后臺(tái)無(wú)聲蒸發(fā)。

更隱蔽的是Heartbeat(心跳機(jī)制)。

為了保持上下文連貫,OpenClaw默認(rèn)每30分鐘向模型發(fā)送一次“檢查新指令”的請(qǐng)求。如果讓OpenClaw在后臺(tái)運(yùn)行一整天,即使不發(fā)任何指令,它也會(huì)自動(dòng)產(chǎn)生幾十次API調(diào)用。

羅福莉把這種現(xiàn)象稱為“Token的粗放型消耗”,上下文管理混亂、緩存命中率低下、多輪對(duì)話中充斥著大量低價(jià)值的重復(fù)計(jì)算。

在她看來,OpenClaw這類工具像是一個(gè)沒有經(jīng)過工程優(yōu)化的原型車,每公里的油耗是正常車輛的十倍。

這樣的消耗,輕度玩家還能勉強(qiáng)接受:偶爾丟幾個(gè)任務(wù),整理文檔、查資料、寫份報(bào)告,一個(gè)月下來幾百萬(wàn)token,折合人民幣幾塊到幾十塊,勉強(qiáng)還在嘗鮮區(qū)間。

可一旦進(jìn)入中度、重度使用,或者讓龍蝦24小時(shí)待命,賬單就徹底失控。

02

廠商的限額游戲

用戶感覺養(yǎng)蝦貴,只是冰山一角。

水面之下,廠商們正在經(jīng)歷更殘酷的現(xiàn)實(shí),他們也在失血,而且失血速度遠(yuǎn)超預(yù)期。

Anthropic的訂閱制,本來是給普通用戶“包月刷網(wǎng)頁(yè)、聊聊天”的福利,結(jié)果被OpenClaw這類高強(qiáng)度Agent徹底玩崩。

比如Claude Max 每月200美元的訂閱,被用戶用龍蝦跑24小時(shí)循環(huán)、工具調(diào)用,直接燒出價(jià)值5000美元的算力。

有行業(yè)分析師估算,OpenClaw用戶通過訂閱套利產(chǎn)生的API消耗,與實(shí)際支付價(jià)格之間存在超過5倍的價(jià)差。

當(dāng)Anthropic被全球開發(fā)者用龍蝦瘋狂薅羊毛,結(jié)構(gòu)性虧損直接擺上桌面。

所以Anthropic的封禁來得又快又狠,Claude Pro、Max、Free所有訂閱額度,一夜之間全部和OpenClaw說再見。用戶只能老老實(shí)實(shí)走API,按token一分一厘地付錢。

Google同樣也在大面積封禁濫用賬號(hào),不再為龍蝦的高消耗兜底。

相比之下,國(guó)內(nèi)廠商則更早看清了龍蝦的本質(zhì),紛紛推出明碼標(biāo)價(jià)的限額套餐,把token消耗從“無(wú)限”變成“包月封頂”。

比如,阿里云百煉的Coding Plan,早期推出的Lite基礎(chǔ)套餐首月只要7.9元(常規(guī)40元/月),每月18000次API請(qǐng)求;Pro高級(jí)套餐首月39.9元(常規(guī)200元/月),拉到每月90000次請(qǐng)求。

騰訊云、百度智能云、火山引擎同樣選擇了激進(jìn)的獲客策略,推出了針對(duì)新客首月7.9元到9.9元/月的Lite套餐。

在各種套餐設(shè)計(jì)中,廠商們又進(jìn)一步給出了算力消耗的限額。

比如,阿里云官方文檔顯示,Coding Plan適用于Claude Code、OpenClaw等交互式編程工具。

但如果把這套Key拿去做自動(dòng)化腳本、自定義后端、批量調(diào)用等,就屬于違規(guī)濫用,訂閱可能會(huì)被暫;蚍饨。

換句話說,阿里云通過使用場(chǎng)景限制,防止用戶把低價(jià)訂閱跑成持續(xù)性的Agent消耗。

再看騰訊云,Lite套餐限制1200次請(qǐng)求/5小時(shí),9000次/周,18000次/月;Pro套餐限制6000次請(qǐng)求/5小時(shí),45000次/周,90000次/月。

也就是說,用戶買的套餐不僅有額度的限制,還有“5小時(shí)”的限額。

有意思的是,國(guó)內(nèi)廠商這兩周還在繼續(xù)朝更適合養(yǎng)蝦的方向調(diào)整。

進(jìn)入4月后,阿里云百煉的養(yǎng)蝦"性價(jià)比之王"套餐,陷入了售罄狀態(tài)。

漲價(jià)前7.9元/首月的特惠套餐已全面下架,200元/月的Pro套餐也顯示無(wú)貨。

有用戶在開發(fā)者社區(qū)抱怨:"剛想認(rèn)真養(yǎng)蝦,發(fā)現(xiàn)口糧沒了"。

圖片

騰訊云社區(qū)里在3月底已經(jīng)出現(xiàn)了從Coding Plan升級(jí)到Token Plan的方案:

Lite套餐39元/月,3500萬(wàn)tokens;Standard套餐99元/月,1億tokens;

Pro套餐299元/月,3.2億tokens;Max套餐599元/月,6.5億tokens。

文案里直接寫明是“針對(duì)龍蝦場(chǎng)景全新升級(jí)的專屬訂閱套餐”。

小米MiMo在4月3日也上線了四檔Token Plan:

Lite套餐39元/月、Standard套餐99元/月、Pro套餐329元/月、Max套餐659元/月,分別對(duì)應(yīng)6000萬(wàn)、2億、7億和16億Credits,而且特別強(qiáng)調(diào)“無(wú)5小時(shí)token使用限額”。

一個(gè)明顯的變化是,從賣Token變成賣Credits,說明小米不想只賣模型調(diào)用量,而是開始賣不同能力層級(jí)、不同上下文長(zhǎng)度、不同使用強(qiáng)度下的一整套算力預(yù)算。

這些變化本身就表明,國(guó)內(nèi)廠商已經(jīng)在精打細(xì)算,把“養(yǎng)龍蝦”做成一門單獨(dú)的生意。

03

當(dāng)限額撞上剛需

盡管國(guó)內(nèi)廠商已經(jīng)在用補(bǔ)貼換市場(chǎng),推出各種算力套餐,但撞上用戶的真實(shí)需求時(shí),反饋卻很分化。

有科技公司的產(chǎn)品經(jīng)理記錄了他的真實(shí)成本:

第一周采用了騰訊云的Lite套餐,額度很快耗盡;接著升級(jí)Pro套餐,額度也快速耗盡。之后就是按API超額量計(jì)費(fèi),再加上云服務(wù)的費(fèi)用,一周不到就花掉了3000多塊。

“比雇個(gè)實(shí)習(xí)生還貴",他在采訪中忍不住吐槽。

一位前端開發(fā)者在開發(fā)者社區(qū)發(fā)帖,他讓OpenClaw配合MiMo-V2-Pro做代碼審查、自動(dòng)生成 changelog 和小范圍修 Bug,但很快就燒光了2億Credit額度。

"我買了Standard套餐,以為能撐半個(gè)月,結(jié)果幾天就收到額度預(yù)警",他在帖子中寫道:"現(xiàn)在我在手動(dòng)數(shù)還剩多少個(gè)任務(wù),像手機(jī)流量快用完時(shí)的那種焦慮"。

比起套餐不夠用,用戶更焦慮的是算不清。

國(guó)內(nèi)廠商開始普遍采用Token-Credit換算體系,但換算系數(shù)如同迷宮;同時(shí),用戶使用不同模型,消耗系數(shù)也不同。

一位全棧工程師在博客中寫道:"我需要一個(gè)Excel表格來實(shí)時(shí)計(jì)算當(dāng)前消耗,這比寫代碼還累。用OpenClaw是為了提效,結(jié)果變成了成本會(huì)計(jì)"。

這種不確定性直接抑制了使用深度。

當(dāng)用戶每次點(diǎn)擊發(fā)送前都要猶豫,這會(huì)不會(huì)燒掉我半個(gè)任務(wù)額度,OpenClaw就從生產(chǎn)力工具退化成了成本實(shí)驗(yàn)。

還有一類常見的吐槽,是量有了,但任務(wù)完不成。

火山引擎開發(fā)者社區(qū)顯示,Coding Plan不是只有月度總額,而是同時(shí)卡每5小時(shí)、每周、每月三層限額,一旦觸發(fā),系統(tǒng)會(huì)直接提示“已超出5小時(shí)使用配額”。

對(duì)長(zhǎng)任務(wù)、多輪調(diào)用、上下文不斷膨脹的龍蝦類Agent來說,這種限制的殺傷力在于,套餐看起來還有余額,但任務(wù)可能已經(jīng)先被中斷。

這種挫敗感在中小企業(yè)中尤為普遍。

當(dāng)OpenClaw從個(gè)人玩具變成團(tuán)隊(duì)工具,限額套餐就不再只是控制成本的手段,而會(huì)變成任務(wù)完成的問題。

當(dāng)然,也不是所有用戶都對(duì)廠商的套餐不滿意。

如果任務(wù)沒那么重、對(duì)完成率要求沒那么苛刻,國(guó)內(nèi)低價(jià)套餐會(huì)顯得便宜到離譜。

比如有用戶提到,之前阿里云7.9元/月的Lite套餐,僅OpenClaw就用了7億token,但是套餐才用了40%的量。

還有人說騰訊云的Coding Plan“使勁用,5小時(shí)都不會(huì)超50%”。

用戶不同情緒的背后,是廠商的兩難。

龍蝦這類Agent的消耗天然不可預(yù)測(cè),當(dāng)廠商用限額套餐試圖解決這個(gè)成本黑洞時(shí),用戶感受到的不是成本控制,而是能力閹割。

一位開發(fā)者在知乎的總結(jié)獲得了高贊:

"國(guó)外大廠選擇封禁,是承認(rèn)自己做不了這門生意;國(guó)內(nèi)廠商選擇限額,是假裝自己能做但得給你戴手銬。Neither is a good answer"。

04

解決成本黑洞

真正的答案,或許藏在技術(shù)社區(qū)里。

當(dāng)廠商的套餐無(wú)法滿足需求時(shí),用戶正在被迫成為自己的“成本會(huì)計(jì)”。

目前社區(qū)用戶已經(jīng)摸索出幾條實(shí)打?qū)嵉慕当韭窂健?/p>

第一種,是模型分級(jí)+智能路由。

一位開發(fā)了ClawEasy優(yōu)化工具的創(chuàng)業(yè)者,提出了一套智能模型路由方案,具體做法是在OpenClaw配置中植入常規(guī)任務(wù)、復(fù)雜任務(wù)、不確定任務(wù)三層路由邏輯。

比如,日常規(guī)劃、工具調(diào)用、簡(jiǎn)單代碼全扔給便宜快速模型,只有跨模塊重構(gòu)、架構(gòu)決策才切成更貴的模型,關(guān)鍵是讓便宜模型先試。

更激進(jìn)的玩家開始引入本地模型作為第一道防線。

通過Ollama在本地運(yùn)行DeepSeek-R1,簡(jiǎn)單任務(wù)實(shí)現(xiàn)"零Token成本",只有本地模型跑不通時(shí)才調(diào)用云端API。

一位實(shí)現(xiàn)了本地-云端混合架構(gòu)的開發(fā)者計(jì)算:原本每月$800的純?cè)贫朔桨,替換為70%本地+30%云端后,實(shí)際支出降至$240,且響應(yīng)延遲從800ms降至60ms。代價(jià)是初期投入$2000購(gòu)置硬件,但三個(gè)月就回本了。

第二種,是上下文工程,這也是羅福莉點(diǎn)名的命門。

在GitHub社區(qū),Work-Fisher發(fā)起的上下文壓縮項(xiàng)目獲得了廣泛關(guān)注。

這位前端開發(fā)者發(fā)現(xiàn),OpenClaw的默認(rèn)對(duì)話格式充斥著大量語(yǔ)義冗余:禮貌用語(yǔ)、重復(fù)確認(rèn)、過度解釋,這些對(duì)人類友好的設(shè)計(jì),對(duì)模型來說是昂貴的噪音。

他開發(fā)的壓縮方案把對(duì)話轉(zhuǎn)為純結(jié)構(gòu)化格式,并啟用提示詞緩存:重復(fù)的系統(tǒng)指令和歷史記錄直接復(fù)用,命中率拉高后,每次調(diào)用成本直降70%。

Reddit上有用戶實(shí)測(cè),在Claude系模型上緩存命中率能穩(wěn)定在91%-95%;沒有緩存的話,整體支出會(huì)高出大約5倍。

目前,阿里云、MiniMax等廠商也都已經(jīng)開始支持自動(dòng)緩存,把Agent從粗放燒token改造成更會(huì)省token的系統(tǒng)。

第三種,是監(jiān)控儀表盤,徹底杜絕OpenClaw心跳事故。 

解決方案是后臺(tái)設(shè)硬性額度上限,一到就停;內(nèi)置監(jiān)控儀表盤,實(shí)時(shí)查看消耗;再加超時(shí)機(jī)制,每個(gè)任務(wù)設(shè)最大步數(shù)上限,卡住就自動(dòng)回退人工。

用戶反饋很直接:以前一覺醒來心跳燒掉上百塊,現(xiàn)在睡得著覺了。

這些自救方案有效,但都有一個(gè)隱性成本,就是用戶被迫成為自己的成本工程師。

一位實(shí)踐了上述所有優(yōu)化技巧的開發(fā)者,在博客中坦承:"我現(xiàn)在每天花30分鐘監(jiān)控Token消耗、調(diào)整模型路由參數(shù)、清理歷史上下文。OpenClaw省下的錢,變成了我的時(shí)間成本。這是進(jìn)步還是倒退?"

這個(gè)問題沒有標(biāo)準(zhǔn)答案。

但可以確定的是,當(dāng)OpenClaw從開箱即用的工具,變成需要精密調(diào)優(yōu)的系統(tǒng)時(shí),它的用戶群體正在悄然分層:

輕度用戶被套餐限額勸退,回歸AI網(wǎng)頁(yè)版;

中度用戶在廠商套餐與優(yōu)化技巧間掙扎,成為成本會(huì)計(jì);

重度用戶被迫走向架構(gòu)重構(gòu)的深水區(qū),成為真正的成本工程師。

人們還在養(yǎng)蝦,但養(yǎng)法已經(jīng)從隨意消耗變成了精打細(xì)算。

05

結(jié)語(yǔ)

龍蝦沒有涼。

那些關(guān)于套餐、限額、緩存和心跳的討論,恰恰證明了一件事:用戶已經(jīng)從嘗鮮者變成了使用者。

任何一個(gè)工具從極客玩具變成基礎(chǔ)設(shè)施,中間都要經(jīng)過有人開始認(rèn)真算賬的時(shí)刻。

龍蝦現(xiàn)在就在這個(gè)時(shí)刻。

       原文標(biāo)題 : 養(yǎng)蝦人,開始認(rèn)真算賬了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)