123,123

面壁智能，大模型“另類”生存法則

2026-04-21 15:36

光子星球

關注

撰文 | 郝鑫

編輯 | 吳先之

面壁智能，是中國大模型行業(yè)中的“另類”。

在國內外大肆流行Scaling Law（規(guī)模定律），即奉行參數(shù)越大、數(shù)據(jù)越多、算力越強，模型能力就越強的時候。

面壁智能則反其道行之，遵循“知識密度”，即用更少的參數(shù)實現(xiàn)更強的能力；以及“密度法則”，即在有限算力下，持續(xù)提升模型能力密度。

一個是“大力出奇跡”，一個是“以小博大”，這注定一開始面壁就與主流的“AI六小龍”走上了不同的道路。

有趣的是，面壁智能與“AI六小龍”的命運，在無形中形成了一個大寫的“X”。交匯點是大模型洗牌期，早期風頭無兩的零一萬物和百川智能，出現(xiàn)了明顯掉隊的跡象，智譜、MiniMax成功“上岸”，月之暗面和階躍星辰只差臨門一腳。

在這過程中，面壁智能的處境可以用“夾縫生存”和“逆流而上”來形容。沒有打在身上的聚光燈、沒有超高金額的融資，面壁智能咬緊“端側”方向，接連躲過了算力戰(zhàn)、價格戰(zhàn)和C端流量戰(zhàn)。

保存實力的打法，不僅讓面壁智能活了下來，而且也成為了一股不可忽視的力量。

自2023年4月至今，約三年時間，面壁智能完成了7輪融資，幾乎每半年一輪，頻率高于多數(shù)同期創(chuàng)業(yè)公司。

經(jīng)過多輪融資后，截至今年4月最近的新一輪融資，面壁智能正式邁入大模型獨角獸門檻（10億美元級別），位列當前中國大模型第二梯隊前列。

“錯位”的市場預期

2023年，Agent對大多數(shù)人來說，仍是一個模糊的概念，構成其認知的主要來源來自于學術論文。那一年，關于Agent最熱門的話題是“斯坦福小鎮(zhèn)”。

當時，行業(yè)對Agent認知到什么程度呢？一個例子或許能說明些問題，有歸國的創(chuàng)業(yè)者在小型論壇上介紹其Agent創(chuàng)業(yè)項目，至少得花一個小時的時間科普Agent的概念，只因為太過于抽象。

就是在這樣的環(huán)境下，面壁智能在2023年末，一口氣發(fā)布了AI智能體應用框架“XAgent”、智能體通用平臺“AgentVerse”、多智能體協(xié)作開發(fā)框架“ChatDev”以及一款AI開發(fā)軟件。

在對媒體的閉門交流會上，面壁智能也不得不以，大家更為熟悉的“Copilot”“SaaS”等概念，來解釋Agent。以現(xiàn)在的眼光來看，當時面壁智能已經(jīng)有了Vibe Coding的想法。

面壁智能相關負責人告訴光子星球，他們判斷，“AI Agent是大模型落地場景的重要路徑，未來會是Agent的世界，萬物都是Agent”。

電飯鍋可以是Agent，放入食材后，根據(jù)熬粥的邏輯，自動加熱；冰箱也是Agent，如果出現(xiàn)冷卻劑故障情況，會通過對話提醒，待確認后預約維修師傅上門。

電飯鍋和冰箱的比喻，核心不是讓家電“會說話”，而是賦予它們自主感知、自主決策、自主執(zhí)行的主體地位。

這也為后面押注端側埋下了伏筆，因為“萬物Agent”與“硬件端側”，是靈魂與肉體的關系。沒有端側模型這個肉體，Agent的靈魂只能是游蕩在云端，無法干預物理世界的幽靈。沒有Agent這個靈魂，端側模型就只是一個更小的模型文件，缺乏明確的應用指向。

理想很豐滿，現(xiàn)實卻很骨感。時間線拉回到2023年，百度文心、阿里通義、騰訊混元大模型在上半年才剛剛發(fā)布，下半年月之暗面的Kimi助手也才剛開啟內測。

2024年初，面壁智能開始把重心轉移到端側上，以小鋼炮MiniCPM拉開了序幕。用面壁智能CEO李大海的話來說，“以小博大”“以大博聚”構成了面壁智能的核心能力。其核心要義就是要用最少的資源、最小的規(guī)模達到最佳的性能。

截至目前，MiniCPM模型已經(jīng)更新到了3.0系列，模型參數(shù)始終控制在10B以下，且逐步從通用語言模型擴展至多模態(tài)、全模態(tài)和垂直場景專用模型。

大模型和小模型是一組相對的概念，如果把“AI六小龍”的戰(zhàn)場視為大模型，那面壁智能的主戰(zhàn)場始終就在“小模型”上。

有AI創(chuàng)業(yè)者認為，比起參數(shù)規(guī)模超大的模型，規(guī)模在幾十億到百億的中小模型，更具實用價值。“開源百億參數(shù)的模型，便利中小企業(yè)，幾十億規(guī)模的模型，幾乎開發(fā)者都能上手”。而國內模型生態(tài)，最缺乏的就是中小模型這塊“拼圖”。

兩者各有所長，在需要復雜知識推理、長文檔分析、專業(yè)內容生成的生產力或創(chuàng)作場景中，“AI六小龍”的云端模型不可或缺。但在需要實時交互、隱私保護、穩(wěn)定可靠的汽車、手機、IoT設備中，面壁的端側模型則更有優(yōu)勢。

兩者共同構成了，“云端訓練大腦，端側執(zhí)行小腦”的完整AI產業(yè)拼圖。

避開正面戰(zhàn)場

巨頭下場，加快了大模型行業(yè)的洗牌速度。“AI六小龍”被迫卷進了地獄級的消耗戰(zhàn)。

面壁智能不僅沒有被這波浪潮拍打到，反而因為浪潮拍打了別人，凸顯了自身的價值。

不碰千億、萬億參數(shù)模型，相當于主動放棄進入算力黑洞的入場券。其模型運行在客戶的手機、汽車和終端芯片上，根本不走云端API計費，因此避免了陷入價格戰(zhàn)的漩渦。不做需要日活、月活、留存率的超級APP，既不用花費高昂的市場營銷費用，又避開了與互聯(lián)網(wǎng)大廠的流量碾壓戰(zhàn)。

以面壁智能為代表的端側模型廠商，直擊了企業(yè)的數(shù)據(jù)隱私痛點，這成為其核心競爭力之一。對企業(yè)而言，涉及關鍵性和敏感性的數(shù)據(jù)，不可能直接喂給大模型，特別是大型國有企業(yè)。

還有需要及時反饋的場景，端側模型的作用遠大于通用大模型。拿具身智能領域的場景舉例，當人形機器人試圖跨過路障時，需要其立即判斷該路障的高度、硬度以及應對姿勢。此時，模型調用不會發(fā)生在公有云上，因為有網(wǎng)絡延時，而是通過內置蒸餾的本地小模型，完成及時響應。

“AI六小龍”的戰(zhàn)場是算力密集型，既誰的GPU多、誰的參數(shù)大，誰就有話語權。這是互聯(lián)網(wǎng)大廠和美元基金的主場。

而面壁智能的邏輯是，端側戰(zhàn)場是能效密集型，即誰能在10億參數(shù)內、50毫秒延遲、100毫瓦功耗的極限約束下，做出接近云端模型的效果，誰就能領跑。這是一個被巨頭忽視的技術角落。

選定戰(zhàn)場后，面壁智能開始做巨頭不愿做的“臟活累活”。

有行業(yè)人士告訴我們，“芯片和手機大廠在自研端側模型或模型時，多數(shù)只會針對自身產品做優(yōu)化，這一點上大家是垂直封閉的。”

面壁智能作為中立的第三方，則可以為所有主流平臺提供統(tǒng)一的模型接口和最優(yōu)適配。對于車企和Tier 1來說，這意味著“一次集成，多平臺部署，極大降低了開發(fā)成本”。

這一步的核心是用工程苦力構建兼容性壁壘。面壁的護城河不是一行精妙的算法，而是幾萬行適配代碼和對幾十種芯片的深刻理解。這種壁壘，巨頭不愿意建，小公司建不起。

成立初期，面壁智能就瞄準了B端客戶，從最早的金融和營銷領域，逐步擴展至現(xiàn)在的汽車、具身智能、教育等領域。

值得一提的是，面壁智能的客戶多來自于被巨頭擠壓，但又不想完全依附于巨頭的二線玩家。這里面有對抗ARM、英特爾生態(tài)，需要獨立AI軟件棧的龍芯；不愿被華為、小米等智能座艙生態(tài)綁定的保時捷；在AI云服務上不想完全依賴于阿里等大廠的中國電信等。

以上提到的客戶名字，均出現(xiàn)在了面壁智能B輪到C輪的融資名單中。通過股權與業(yè)務綁定，面壁智能試圖把自己變成了硬件產品的一個組件。

這意味著，只要搭載面壁模型的汽車、手機在出貨，它就有持續(xù)收入。這就像英偉達的顯卡驅動，用戶感覺不到，但不可或缺。

另外，面壁智能還在開拓信創(chuàng)領域。在泛司法、政務、金融等場景，數(shù)據(jù)不出終端是法律紅線。面壁智能的端側私有化部署能力，使其成為這些領域的合法選項。這不是技術競爭，是合規(guī)準入競爭。

等風來

技術創(chuàng)新擴散理論提到，一項技術從實驗室到產業(yè)化中間，存在“概念先行，條件滯后”的經(jīng)典時間差。

面壁智能在Agent方面的主張恰好印證了上述觀點。2023年的Agent，更像是面壁智能的超前技術宣言，向外界展示了目的地，但缺少了通往終點的路和車。

2023年的Agent土壤面臨著先天性不足，彼時最強的開源模型是LLaMA 2，閉源模型是GPT-3.5/GPT-4初代。這些模型雖然在生成文本上驚艷，但在邏輯規(guī)劃、任務拆解、工具調用、長程記憶這四個Agent核心能力上極不穩(wěn)定。當時的Agent是“玩具”，不是“工具”。

彼時，大多數(shù)企業(yè)還在消化“什么是大模型”。而面壁智能提出的“一句話開發(fā)軟件”和“多智能體協(xié)作”，對應的是高度數(shù)字化、流程標準化的理想組織。當時絕大多數(shù)企業(yè)的數(shù)字化基座根本不支持Agent去執(zhí)行操作。Agent反倒成了空中樓閣。

現(xiàn)在的面壁智能，能被關注是因為它主動放棄了以Agent為賣點，轉而把Agent能力壓縮進了端側模型的“地基”里。

2026年初，“龍蝦”OpenClaw在全球爆發(fā)，成為了面壁智能等待的一股東風。