訂閱
糾錯
加入自媒體

面壁智能,大模型“另類”生存法則

2026-04-21 15:36
光子星球
關注

撰文 | 郝   鑫

編輯 | 吳先之

面壁智能,是中國大模型行業(yè)中的“另類”。

在國內外大肆流行Scaling Law(規(guī)模定律),即奉行參數(shù)越大、數(shù)據(jù)越多、算力越強,模型能力就越強的時候。

面壁智能則反其道行之,遵循“知識密度”,即用更少的參數(shù)實現(xiàn)更強的能力;以及“密度法則”,即在有限算力下,持續(xù)提升模型能力密度。

一個是“大力出奇跡”,一個是“以小博大”,這注定一開始面壁就與主流的“AI六小龍”走上了不同的道路。

有趣的是,面壁智能與“AI六小龍”的命運,在無形中形成了一個大寫的“X”。交匯點是大模型洗牌期,早期風頭無兩的零一萬物和百川智能,出現(xiàn)了明顯掉隊的跡象,智譜、MiniMax成功“上岸”,月之暗面和階躍星辰只差臨門一腳。

在這過程中,面壁智能的處境可以用“夾縫生存”和“逆流而上”來形容。沒有打在身上的聚光燈、沒有超高金額的融資,面壁智能咬緊“端側”方向,接連躲過了算力戰(zhàn)、價格戰(zhàn)和C端流量戰(zhàn)。

保存實力的打法,不僅讓面壁智能活了下來,而且也成為了一股不可忽視的力量。

自2023年4月至今,約三年時間,面壁智能完成了7輪融資,幾乎每半年一輪,頻率高于多數(shù)同期創(chuàng)業(yè)公司。

經(jīng)過多輪融資后,截至今年4月最近的新一輪融資,面壁智能正式邁入大模型獨角獸門檻(10億美元級別),位列當前中國大模型第二梯隊前列。

“錯位”的市場預期

2023年,Agent對大多數(shù)人來說,仍是一個模糊的概念,構成其認知的主要來源來自于學術論文。那一年,關于Agent最熱門的話題是“斯坦福小鎮(zhèn)”。

當時,行業(yè)對Agent認知到什么程度呢?一個例子或許能說明些問題,有歸國的創(chuàng)業(yè)者在小型論壇上介紹其Agent創(chuàng)業(yè)項目,至少得花一個小時的時間科普Agent的概念,只因為太過于抽象。

就是在這樣的環(huán)境下,面壁智能在2023年末,一口氣發(fā)布了AI智能體應用框架“XAgent”、智能體通用平臺“AgentVerse”、多智能體協(xié)作開發(fā)框架“ChatDev”以及一款AI開發(fā)軟件。

在對媒體的閉門交流會上,面壁智能也不得不以,大家更為熟悉的“Copilot”“SaaS”等概念,來解釋Agent。以現(xiàn)在的眼光來看,當時面壁智能已經(jīng)有了Vibe Coding的想法。

面壁智能相關負責人告訴光子星球,他們判斷,“AI Agent是大模型落地場景的重要路徑,未來會是Agent的世界,萬物都是Agent”。

電飯鍋可以是Agent,放入食材后,根據(jù)熬粥的邏輯,自動加熱;冰箱也是Agent,如果出現(xiàn)冷卻劑故障情況,會通過對話提醒,待確認后預約維修師傅上門。

電飯鍋和冰箱的比喻,核心不是讓家電“會說話”,而是賦予它們自主感知、自主決策、自主執(zhí)行的主體地位。

這也為后面押注端側埋下了伏筆,因為“萬物Agent”與“硬件端側”,是靈魂與肉體的關系。沒有端側模型這個肉體,Agent的靈魂只能是游蕩在云端,無法干預物理世界的幽靈。沒有Agent這個靈魂,端側模型就只是一個更小的模型文件,缺乏明確的應用指向。

理想很豐滿,現(xiàn)實卻很骨感。時間線拉回到2023年,百度文心、阿里通義、騰訊混元大模型在上半年才剛剛發(fā)布,下半年月之暗面的Kimi助手也才剛開啟內測。

2024年初,面壁智能開始把重心轉移到端側上,以小鋼炮MiniCPM拉開了序幕。用面壁智能CEO李大海的話來說,“以小博大”“以大博聚”構成了面壁智能的核心能力。其核心要義就是要用最少的資源、最小的規(guī)模達到最佳的性能。

截至目前,MiniCPM模型已經(jīng)更新到了3.0系列,模型參數(shù)始終控制在10B以下,且逐步從通用語言模型擴展至多模態(tài)、全模態(tài)和垂直場景專用模型。

大模型和小模型是一組相對的概念,如果把“AI六小龍”的戰(zhàn)場視為大模型,那面壁智能的主戰(zhàn)場始終就在“小模型”上。

有AI創(chuàng)業(yè)者認為,比起參數(shù)規(guī)模超大的模型,規(guī)模在幾十億到百億的中小模型,更具實用價值。“開源百億參數(shù)的模型,便利中小企業(yè),幾十億規(guī)模的模型,幾乎開發(fā)者都能上手”。而國內模型生態(tài),最缺乏的就是中小模型這塊“拼圖”。

兩者各有所長,在需要復雜知識推理、長文檔分析、專業(yè)內容生成的生產力或創(chuàng)作場景中,“AI六小龍”的云端模型不可或缺。但在需要實時交互、隱私保護、穩(wěn)定可靠的汽車、手機、IoT設備中,面壁的端側模型則更有優(yōu)勢。

兩者共同構成了,“云端訓練大腦,端側執(zhí)行小腦”的完整AI產業(yè)拼圖。

避開正面戰(zhàn)場

巨頭下場,加快了大模型行業(yè)的洗牌速度。“AI六小龍”被迫卷進了地獄級的消耗戰(zhàn)。

面壁智能不僅沒有被這波浪潮拍打到,反而因為浪潮拍打了別人,凸顯了自身的價值。

不碰千億、萬億參數(shù)模型,相當于主動放棄進入算力黑洞的入場券。其模型運行在客戶的手機、汽車和終端芯片上,根本不走云端API計費,因此避免了陷入價格戰(zhàn)的漩渦。不做需要日活、月活、留存率的超級APP,既不用花費高昂的市場營銷費用,又避開了與互聯(lián)網(wǎng)大廠的流量碾壓戰(zhàn)。

以面壁智能為代表的端側模型廠商,直擊了企業(yè)的數(shù)據(jù)隱私痛點,這成為其核心競爭力之一。對企業(yè)而言,涉及關鍵性和敏感性的數(shù)據(jù),不可能直接喂給大模型,特別是大型國有企業(yè)。

還有需要及時反饋的場景,端側模型的作用遠大于通用大模型。拿具身智能領域的場景舉例,當人形機器人試圖跨過路障時,需要其立即判斷該路障的高度、硬度以及應對姿勢。此時,模型調用不會發(fā)生在公有云上,因為有網(wǎng)絡延時,而是通過內置蒸餾的本地小模型,完成及時響應。

“AI六小龍”的戰(zhàn)場是算力密集型,既誰的GPU多、誰的參數(shù)大,誰就有話語權。這是互聯(lián)網(wǎng)大廠和美元基金的主場。

而面壁智能的邏輯是,端側戰(zhàn)場是能效密集型,即誰能在10億參數(shù)內、50毫秒延遲、100毫瓦功耗的極限約束下,做出接近云端模型的效果,誰就能領跑。這是一個被巨頭忽視的技術角落。

選定戰(zhàn)場后,面壁智能開始做巨頭不愿做的“臟活累活”。

有行業(yè)人士告訴我們,“芯片和手機大廠在自研端側模型或模型時,多數(shù)只會針對自身產品做優(yōu)化,這一點上大家是垂直封閉的。”

面壁智能作為中立的第三方,則可以為所有主流平臺提供統(tǒng)一的模型接口和最優(yōu)適配。對于車企和Tier 1來說,這意味著“一次集成,多平臺部署,極大降低了開發(fā)成本”。

這一步的核心是用工程苦力構建兼容性壁壘。面壁的護城河不是一行精妙的算法,而是幾萬行適配代碼和對幾十種芯片的深刻理解。這種壁壘,巨頭不愿意建,小公司建不起。

成立初期,面壁智能就瞄準了B端客戶,從最早的金融和營銷領域,逐步擴展至現(xiàn)在的汽車、具身智能、教育等領域。

值得一提的是,面壁智能的客戶多來自于被巨頭擠壓,但又不想完全依附于巨頭的二線玩家。這里面有對抗ARM、英特爾生態(tài),需要獨立AI軟件棧的龍芯;不愿被華為、小米等智能座艙生態(tài)綁定的保時捷;在AI云服務上不想完全依賴于阿里等大廠的中國電信等。

以上提到的客戶名字,均出現(xiàn)在了面壁智能B輪到C輪的融資名單中。通過股權與業(yè)務綁定,面壁智能試圖把自己變成了硬件產品的一個組件。

這意味著,只要搭載面壁模型的汽車、手機在出貨,它就有持續(xù)收入。這就像英偉達的顯卡驅動,用戶感覺不到,但不可或缺。

另外,面壁智能還在開拓信創(chuàng)領域。在泛司法、政務、金融等場景,數(shù)據(jù)不出終端是法律紅線。面壁智能的端側私有化部署能力,使其成為這些領域的合法選項。這不是技術競爭,是合規(guī)準入競爭。

等風來

技術創(chuàng)新擴散理論提到,一項技術從實驗室到產業(yè)化中間,存在“概念先行,條件滯后”的經(jīng)典時間差。

面壁智能在Agent方面的主張恰好印證了上述觀點。2023年的Agent,更像是面壁智能的超前技術宣言,向外界展示了目的地,但缺少了通往終點的路和車。

2023年的Agent土壤面臨著先天性不足,彼時最強的開源模型是LLaMA 2,閉源模型是GPT-3.5/GPT-4初代。這些模型雖然在生成文本上驚艷,但在邏輯規(guī)劃、任務拆解、工具調用、長程記憶這四個Agent核心能力上極不穩(wěn)定。當時的Agent是“玩具”,不是“工具”。

彼時,大多數(shù)企業(yè)還在消化“什么是大模型”。而面壁智能提出的“一句話開發(fā)軟件”和“多智能體協(xié)作”,對應的是高度數(shù)字化、流程標準化的理想組織。當時絕大多數(shù)企業(yè)的數(shù)字化基座根本不支持Agent去執(zhí)行操作。Agent反倒成了空中樓閣。

現(xiàn)在的面壁智能,能被關注是因為它主動放棄了以Agent為賣點,轉而把Agent能力壓縮進了端側模型的“地基”里。

2026年初,“龍蝦”OpenClaw在全球爆發(fā),成為了面壁智能等待的一股東風。

OpenClaw讓市場第一次直觀感受到,AI能動手干活了。但用戶很快發(fā)現(xiàn),云端Agent存在隱私裸奔、網(wǎng)絡依賴、成本高昂三大痛點。

市場自然產生了一個追問,有沒有一種Agent,能斷網(wǎng)運行、數(shù)據(jù)本地處理、還不按次收費?這個問題的標準答案,恰好指向面壁智能深耕三年的端側Agent方案。

行業(yè)中有專家就指出,未來發(fā)展的方向就是端云協(xié)同。

云端大腦利用其強大的全局規(guī)劃和復雜推理能力,負責長程任務的戰(zhàn)略分解、意圖理解和最終結果的校驗;端側是手腳,利用其低延遲、高隱私、低成本的特性,在手機、PC、汽車等設備上,負責執(zhí)行被拆解好的、具體的、短周期的子任務。

即使這樣,面壁智能的頭上依然籠罩著估值的陰影。面壁的估值絕對數(shù)值并不低,但與六小龍中靠前的幾家相比,確實存在明顯估值差。

大模型和端側模型的想象力固然有差別,但面壁智能所面臨的核心問題最終都要歸結于:到底是硬件定義軟件,還是軟件定義硬件?

面壁智能的端側模型,在市場上逃不開高通、華為、蘋果這些廠商,它們都有自研端側AI能力,且擁有底層的芯片控制權。關于未來的擔憂是,面壁智能是否會重走當年輸入法的老路,最終被手機廠商自研方案替代或邊緣化。

這種“被包餃子”的風險,會壓制其長期估值倍數(shù)。

面壁智能必須不斷證明,自己的算法優(yōu)勢能持續(xù)領先芯片廠的內部團隊一代以上,才能消除這一折價。

       原文標題 : 面壁智能,大模型“另類”生存法則

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號