訂閱
糾錯
加入自媒體

老黃可能開始焦慮了

2026-04-17 10:51
象先志
關注

2026年4月15日,黃仁勛在Dwarkesh Patel 的播客里經(jīng)歷了一場他很久沒經(jīng)歷過的尖銳追問。一個多小時的對話,他反復用來定義英偉達的那句話是:“必須有東西把電子變成token。”他把自家公司形容成“全球每瓦生產(chǎn)token 最多的架構(gòu)”——不是每瓦算力最多,是每瓦 token 最多。

這是一家賣GPU的公司,在重新定義自己。

為什么要重新定義?因為他比任何人都更早地看見一件事——AI 時代的權(quán)力,正在被分成兩種不同的東西。一種是算力,在美國手里;另一種是 token,在中國手里。這兩種權(quán)力不在同一個平面上,誰都吃不掉誰。而英偉達夾在中間,它原來以為自己是最大的贏家,現(xiàn)在發(fā)現(xiàn)自己是這兩個結(jié)構(gòu)里都沒有舒服位置的那個。

這才是他焦慮的真正原因。

算力的地主,token 的租客

先看美國那半邊。

4月14 日,EpochAI 發(fā)布最新數(shù)據(jù)——Amazon、Google、Meta、Microsoft、Oracle 五家美國 hyperscaler 合計持有全球 67% 的 AI 算力,按H100 等價口徑折算。2024 年 Q1 這個數(shù)字是 60%。十八個月里,全球 AI 算力的集中度又提高了七個百分點,而且上行趨勢看不到減速。

這五家公司有一個共同點:它們都不做前沿模型。

Google 算是一個例外,TPU 自研加 Gemini 自己做,但剩下四家的基本身位是“收租的”——Microsoft 靠 Azure 給 OpenAI 租算力,Amazon 靠 AWS 和自家 Trainium 芯片把 Anthropic 綁在身邊,Oracle 靠 Stargate 項目切進 OpenAI的基礎設施版圖,Meta 自己造芯片但主要內(nèi)用,4 月 13 日剛與 Broadcom 簽了 1GW 自研芯片訂單。

那誰在用這些算力?前沿 AI lab 都是它們的租客。Anthropic 剛宣布擴大與Google 的TPU 合作,未來幾年要接入多GW 級算力。OpenAI 的骨干算力是Microsoft Azure 加 Oracle Stargate——OpenAI 在 2 月剛完成 1100 億美元融資,Amazon 投了 500 億,SoftBank 投了 300 億,Nvidia 追加了300 億(從原本承諾的1000 億縮水而來)。xAI 自建集群,但芯片仍然從英偉達買。

美國 AI 產(chǎn)業(yè)真實的權(quán)力結(jié)構(gòu),是這樣的:5 家算力地主 + 3 家前沿模型租客 + 一個 Nvidia。外界以為 OpenAI、Anthropic、xAI 是主角,實際上它們是交租的一方。它們每融一輪錢,都要把大頭交給那五家地主——這五家地主同時也是它們的投資人、它們的供應商、它們的談判對手。

Nvidia 在這個結(jié)構(gòu)里,看上去是最大的贏家。它拿了 2026 財年大約 1150 億美元的數(shù)據(jù)中心收入,市值 3 萬億美元以上。但這個身位的脆弱性,黃仁勛自己看得最清楚。

他在3月的Morgan Stanley大會上宣布,Nvidia 投資 OpenAI 的 300億美元和投資Anthropic 的100億美元大概率都是最后一筆。兩個月前他剛把那100億美元押給Anthropic,Anthropic轉(zhuǎn)身就加大了 TPU合作——Nvidia投資的錢,流回去幫對手做非英偉達的算力。

這是商業(yè)層面的選擇:Anthropic 不能只依賴一家芯片供應商,它必須分散。Nvidia 的客戶結(jié)構(gòu)本來就高度集中——全球算力版圖上,真正的大戶就是那五家美國公司。加上中國市場,那就是它過去兩年數(shù)據(jù)中心業(yè)務的全部核心收入池。2025 年 4 月之后,H20 禁令讓中國這一池水基本蒸發(fā)。剩下的五家客戶,每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon 有Trainium、Google有 TPU、Microsoft 和 Oracle在押 OpenAI 的自研 Titan。

一個賣鏟子的人,面對的客戶是五家正在自己造鏟子的人。這就是美國結(jié)構(gòu)里英偉達的真實處境。

token 的工廠,沒有業(yè)主也沒有租客

再看中國那半邊。

中國前四大云廠商——阿里云、字節(jié)火山引擎、騰訊云、百度智能云——全部都同時在做兩件事:一邊賣算力,一邊做自己的大模型。阿里云的底下是千問(Qwen),火山引擎的底下是豆包和 Seedance,騰訊云的底下是混元,百度智能云的底下是文心。再加上對于對于 AI “新勢力”們錯綜復雜的投資,產(chǎn)業(yè)布局都很完備。

中國的云廠商只能同時做業(yè)主和租客——自己造算力、自己造模型、自己消化 token,最后把 token 作為商品賣給下游企業(yè)。算力、模型、應用三層被同一家公司吃掉,整條價值鏈上只剩下一種東西可以作為商品出貨——token。

阿里是這個鏈條的代表性企業(yè), ATH大家都很熟悉了:CEO 吳泳銘在內(nèi)部備忘錄里給它定下了核心使命:“創(chuàng)造 Token、輸送 Token、應用 Token。” ATH 成立后的一個月,阿里的動作密度是過去兩年之最。

3 月 30 日發(fā)布Qwen3.5-Omni——Qwen 系列近年來第一次從開源走向閉源。緊接著Qwen 3.6 Plus 在OpenRouter上以 4.6 萬億/周的調(diào)用量登頂全球大模型周調(diào)用量冠軍,同系列的Preview 版本拿下第三。今天,ATH 又掏出了最新的開放式世界模型產(chǎn)品Happy Oyster,研發(fā)效率堪稱恐怖。

吳泳銘在 3 月 19 日的財報電話會上說了一句話,分量比 ATH 成立本身更大。他說:企業(yè)在消耗 Token 時不再把它當作 IT 預算,而是當作生產(chǎn)資料。IT 預算是成本項,是被優(yōu)化的對象;生產(chǎn)資料是投入項,是被擴張的對象。一家萬億美金市值的中國公司的 CEO 在財報電話會上告訴華爾街——token 已經(jīng)從“支出”變成了“投入”,從“IT 科目”變成了“經(jīng)濟活動本身”。他給出的具體數(shù)字是:未來五年,阿里云和 AI 商業(yè)化年收入要沖到1000 億美元。按新的 Token 消耗算法,這1000 億美元甚至可以包含電商業(yè)務產(chǎn)生的 AI 收入。

在企業(yè)的動作之前,監(jiān)管則是更早給這場科技的盛宴定下了基調(diào)。3 月 23 日,國家數(shù)據(jù)局局長劉烈宏在中國發(fā)展高層論壇年會上正式把 token 的中文譯名定為“詞元”,并稱其為“智能時代的價值錨點”和“連接技術供給與商業(yè)需求的結(jié)算單位”。第二天國新辦發(fā)布會上,他公布了一組官方數(shù)字——中國日均詞元調(diào)用量突破140 萬億,對比2024 年初的1000 億,兩年增長超過一千倍。

這是把 token 從技術概念抬升為經(jīng)濟統(tǒng)計指標的動作。“流量”之于互聯(lián)網(wǎng)時代,“詞元”之于 AI 時代。OpenRouter 平臺給了這套敘事最硬的數(shù)據(jù)支點——2 月 9 日至 15 日那一周,中國大模型的 Token 調(diào)用量首次超過美國,4.12 萬億對 2.94 萬億。到 4 月初,中國模型周調(diào)用量達到 12.96 萬億,美國模型 3.03 萬億,中國已經(jīng)連續(xù)五周領先,全球調(diào)用量前六全部是中國模型。MiniMax M2.5 發(fā)布后七天調(diào)用量突破 3.07 萬億。Kimi K2.5 發(fā)布不到一個月,近 20 天累計收入超過了月之暗面 2025 全年總收入。智譜 GLM-5 在春節(jié)期間因為流量爆單,公開“尋找算力合伙人”——不是營銷噱頭,是真實訂單把產(chǎn)能撐爆了。

算一下結(jié)構(gòu)差異。美國那半邊,算力是核心資產(chǎn),token 是算力的副產(chǎn)品。中國這半邊反過來——token 是核心商品,算力是生產(chǎn) token 的原料。定價邏輯、商業(yè)模型、公司估值、監(jiān)管指標,全部圍繞兩種不同的東西展開。

大洋那邊充滿了算力,但 token 卻源源不斷從大洋這邊產(chǎn)生。

老黃為什么焦慮

回到 Dwarkesh 的播客。

黃仁勛在訪談里給出一個他反復使用的框架——“five-layer cake”,AI產(chǎn)業(yè)有五層:能源、芯片、系統(tǒng)、模型、應用。他說美國必須在五層里每一層都領先,否則就是敗局。他說中國是全世界開源軟件最大的貢獻者,說這話時連說兩次“Fact”——事實、事實。他說中國占全球 AI 研究員的一半,制造全球 60% 以上的主流芯片,有大量滿電空置的“幽靈數(shù)據(jù)中心”。他說 AI 的大部分進步來自算法進步,不是硬件本身。然后他拋出一句話——如果 DeepSeek 的下一個版本首發(fā)在華為芯片上,對美國來說是災難。

這些話串在一起讀,意思已經(jīng)很清楚了。他的焦慮不是來自“中國追上來”這種宏觀敘事,而是來自一個明確的尷尬窘境——在美國那半邊,他正在失去議價權(quán);在中國那半邊,他正在失去入場券。

在美國那半邊:5家hyperscaler 拿走了 67% 的全球算力,它們是他最大的客戶,也是他最強的對手。它們每一家都在做自研芯片——Meta 剛簽了 1GW的Broadcom 訂單,Amazon 的Trainium 拿下了 Anthropic,Google 的TPU 在吞噬Nvidia的份額。當你的客戶同時是你的對手,當你的市場集中到只剩 5 家買主,你的定價權(quán)就是一個慢慢被蠶食的過程。Anthropic 拿了 Nvidia100 億美元投資兩個月后反手加大 TPU 合作——這件事是趨勢,不是偶然。

在中國那半邊:token生態(tài)正在繞過英偉達。DeepSeek V4 的蓄勢待發(fā),在華為 Ascend 950PR上跑訓練和推理,不走 Nvidia。阿里、字節(jié)、騰訊為此批量下單了幾十萬片華為芯片。Qwen、Kimi 、 MiniMax 們每周產(chǎn)出幾萬億 token 的模型,每多跑一天,華為芯片的裝機量就漲一天。更嚴重的是,這些模型的用戶正在全球擴張——OpenRouter 上中國模型連續(xù)五周超過美國,MiniMax 主打“1 美元跑一小時 AI 數(shù)字員工”,Kimi 的海外付費用戶正在反超國內(nèi)。當世界開發(fā)者的默認技術棧開始從英偉達切換到華為,Nvidia 在這條鏈路上一個字都插不進去。

面對這兩個困境,英偉達過去半年做了兩件事,都可以在這個命題下被重新解讀。

第一件事,親自下場做自己本不該做的產(chǎn)品。3 月的 GTC 上,Nvidia 連發(fā) Cosmos 3(世界基礎模型)、Isaac GR00T N1.7(機器人)、Alpamayo1.5(自動駕駛)、Nemotron(開源大模型家族)——一整套覆蓋物理 AI 和前沿模型的棧。4 月 14 日世界量子日,它發(fā)布 Ising——開源的量子 AI 模型家族,黃仁勛親自給它定性:“AI 成為控制面,成為量子機器的操作系統(tǒng)。”這些發(fā)布加在一起傳遞的信號非常明確:英偉達不再滿足于做芯片,它要做模型、做操作系統(tǒng)、做物理世界的模擬器、做量子計算的控制層。賣鏟子的人開始自己挖礦,不是因為貪心,是因為兩個結(jié)構(gòu)都在擠壓他的原有位置。

第二件事,他把公司的核心指標從“算力”遷移到“產(chǎn)出”。“electrons to tokens” 這個比喻他在 Dwarkesh 訪談里用了不下五次。他把 Nvidia 形容成“全球每瓦生產(chǎn) token 最多的架構(gòu)”——不是每瓦算力最多,是每瓦 token 最多。一家把核心指標從“算力”改成“token”的公司,已經(jīng)承認了這個時代的硬通貨在哪里。

但承認不等于解決。他手里的 GPU 本質(zhì)上還是生產(chǎn)算力的機器,不是直接生產(chǎn) token 的機器。他在兩個結(jié)構(gòu)里都在做對的事——在美國擴張上游、在技術棧上鎖住開發(fā)者——但這些動作都沒法改變基本面:算力和 token 不在同一個平面上。一家只生產(chǎn)算力的公司,無論怎么重新定義自己,都沒法同時占據(jù)兩種權(quán)力。

只做賣鏟人,已經(jīng)不能讓 Nvidia 高枕無虞了。

結(jié)語

AI 時代的權(quán)力結(jié)構(gòu),現(xiàn)在已經(jīng)分成了兩半。

美國那半邊是地產(chǎn)——5 家 hyperscaler 坐在 67% 的全球算力上,前沿 lab 是它們的租客。這個結(jié)構(gòu)里,算力是硬資產(chǎn),估值邏輯是“地皮面積 × 租金”。中國這半邊是工廠——4 家云廠把算力、模型、應用壓成一條流水線,token 是唯一的出貨物。這個結(jié)構(gòu)里,token 是硬通貨,估值邏輯是“產(chǎn)出量 × 單價”。

兩種結(jié)構(gòu)互相不可吃掉。美國的算力地主沒法直接進入中國的 token 工廠——監(jiān)管、生態(tài)、開發(fā)者習慣都攔著。中國的 token 工廠也沒法直接替代美國的算力地主——前沿訓練還是要最先進的硬件,華為 Ascend 追得再快,短期內(nèi)補不上與頂級Nvidia 芯片的代際差距。兩種權(quán)力各自運轉(zhuǎn),各自擴張,各自找各自的出口。

黃仁勛夾在中間。他本來以為自己是這個時代最大的贏家——算力是上游,模型是下游,他給上游和下游都供貨,他是唯一的瓶頸。但瓶頸的位置正在雙向松動。上游那半邊,5 家地主自己造芯片;下游那半邊,中國用國產(chǎn)芯片跑出了自己的 token 生態(tài)。向左擴張(投資OpenAI、Anthropic)沒守住下游,往右擴張還沒證明能守住技術棧。他一個人,兩條戰(zhàn)線,都面臨著增長的困境。

他在播客里說,“必須有東西把電子變成 token”。他是在替英偉達的未來辯護,但這句話本身已經(jīng)承認了——這個時代的硬通貨不是電子,是 token。而生產(chǎn)token最密集的地方,目前不在美國。

他在兩種結(jié)構(gòu)之間,Nvidia正在失去最舒服的位置。

       原文標題 : 老黃可能開始焦慮了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號