123,123

“最炫Agent風”正刮，誰能成為御風者？

2025-08-19 14:17

文 | 佘宗明

PC互聯(lián)網(wǎng)時代的技術(shù)主要呈現(xiàn)界面是Web（網(wǎng)頁），移動互聯(lián)網(wǎng)時代的是App（客戶端），那AI時代的呢？

比爾·蓋茨兩年前的預(yù)言，就給出了答案：AI Agent將是AI最大的賽道，“Agent（智能體）不僅將改變?nèi)藗兣c計算機的互動方式，還將顛覆軟件行業(yè)，引發(fā)自鍵入命令到點擊圖標以來計算機領(lǐng)域最大的革命。”

如果說彼時他的這番斷言還有些超前，那如今“AI Agent時代已來”漸成共識的現(xiàn)實，就是跟他打了個響指。

3個月前，微軟CEO納德拉就在微軟2025年Build大會上表示：“我們已經(jīng)進入了AI Agent時代，正在見證AI系統(tǒng)如何以全新方式幫助我們解決問題。”

有意思的是，當時還跟納德拉進行了連線的馬斯克，旗下AI公司xAI前不久還準備籌建名字內(nèi)涵微軟（Microsoft）的子公司巨硬（MacroHard），定位于打造AI Agent生態(tài)。

在硅谷掀起“最炫Agent風”之際，大洋彼岸的中國科技企業(yè)也正以前瞻的技術(shù)布局與獨特的技術(shù)路徑，在這場決定未來若干年AI應(yīng)用生態(tài)格局的賽道上積極卡位，努力將身位從追趕者變?yōu)轭I(lǐng)跑者。

回顧現(xiàn)代技術(shù)演進史，技術(shù)發(fā)展總是遵循著“技術(shù)突破-產(chǎn)業(yè)聚焦-場景落地”的路徑，AI也不例外。

2023年初，ChatGPT出圈揭開了AI大模型軍備競賽的序幕，兩年多過去了，在“Agent元年”說法的掩映下，全球科技巨頭競爭焦點正從大模型參數(shù)轉(zhuǎn)向Agent。

原因很簡單：隨著大模型參數(shù)規(guī)模擴大帶來的邊際效益遞減，如何讓AI從“被動響應(yīng)工具”變成“主動規(guī)劃執(zhí)行者”，已成行業(yè)新命題。而Agent就是AI從“感知智能”邁向“認知智能”的關(guān)鍵載體，也是連接大模型技術(shù)與真實場景的核心橋梁。

作為能自主理解任務(wù)、規(guī)劃步驟、調(diào)用工具的AI應(yīng)用形態(tài)，Agent可以讓AI不再是孤立的技術(shù)模塊，而是能深度嵌入企業(yè)運營系統(tǒng)的“生產(chǎn)力單元”，解決傳統(tǒng)AI應(yīng)用場景碎片化、投入產(chǎn)出比低等問題，推動AI技術(shù)在產(chǎn)業(yè)側(cè)的應(yīng)用落地。

在硅谷，OpenAI在GPT-4之后，迅速推出GPT-4o Agent，試圖通過連接代碼解釋器、網(wǎng)頁瀏覽器等工具，打破大模型“只能對話不能行動”的局限；微軟則將Copilot深度集成于Windows系統(tǒng)與Office全家桶，提出“Agent for Everyone”戰(zhàn)略；谷歌則押注“多智能體協(xié)作”，發(fā)布了Gemini Agent Suite。

▲國內(nèi)外科技巨頭們都在發(fā)力AI Agent。

在國內(nèi)，科技企業(yè)也在加碼發(fā)力。動作最大的，要數(shù)百度：從2024年發(fā)布文心智能體平臺AgentBuilder，到今年4月推出全球首個內(nèi)容操作系統(tǒng)“滄舟OS”、先發(fā)在行業(yè)內(nèi)率先實現(xiàn)全場景滿足、全鏈路覆蓋的AI Agent GenFlow1.0、上線通用超級智能體App心響，百度在Agent賽道的深耕軌跡清晰可見。

8月18日的百度AIDAY上，百度文庫與百度網(wǎng)盤又聯(lián)合發(fā)布了全球首個全端通用AI Agent GenFlow2.0，以“全端通用”“并行任務(wù)”“記憶可溯”等突破性進展，為國產(chǎn)AI在全球Agent領(lǐng)域的競爭注入了強勁動力。

這極具默契的轉(zhuǎn)向背后，是AI產(chǎn)業(yè)對AI價值的認知再校準：AI的價值不在于炫技，而在于應(yīng)用。AI時代，企業(yè)需要的是能自動生成財報、拆解項目計劃的AI助手，個人需要的是能同步處理郵件、整理資料的AI助力，這些都在倒逼AI從“能說會道”向“能做會干”進化。

盡管被寄予厚望之下，AI Agent迎來了爆發(fā)之勢，但不得不說，當前行業(yè)仍面臨著理想與現(xiàn)實的鴻溝：市面上多數(shù)Agent產(chǎn)品還停留在“單輪對話+插件”階段，并沒邁過從實驗室玩具到生產(chǎn)力工具的那道門檻。

今年4月，Gartner就發(fā)布報告稱，市場上正充斥著所謂的“智能體洗牌”現(xiàn)象，即廠商將普通AI助手或ChatBot重新包裝為“智能體”，但這些產(chǎn)品實際缺乏真正的自主智能能力。

揆諸現(xiàn)實，當下很多Agent跟用戶現(xiàn)實期待仍有不小差距，這具體反映在幾個方面：

1，任務(wù)拆解能力不足。許多Agent在處理復(fù)雜任務(wù)時，會出現(xiàn)邏輯斷裂。

你讓它“生成新能源汽車市場季度分析報告，需包含政策分析、競品數(shù)據(jù)和趨勢預(yù)測”，它可能要么遺漏“政策分析”等關(guān)鍵模塊，要么將“競品數(shù)據(jù)”局限于單一品牌，最終產(chǎn)出的結(jié)果經(jīng)常需要人工大幅修改。

這是因為當前很多Agent的任務(wù)規(guī)劃算法仍依賴簡單的規(guī)則匹配，缺乏對復(fù)雜需求的深度理解與動態(tài)調(diào)整能力，無法像人那樣將復(fù)雜目標拆解為“數(shù)據(jù)采集—分析建模—內(nèi)容生成—格式轉(zhuǎn)換”等有序子任務(wù)。

2，結(jié)果質(zhì)量不可控。不少Agent生成的內(nèi)容，動輒存在低級錯誤。

我曾用某教育類Agent幫我生成講座課件，結(jié)果PPT中出現(xiàn)了“媒介即訊息是尼爾·波茲曼提出”的結(jié)論。

根源在于，這些Agent缺乏專業(yè)知識庫，無法安全訪問私域資源（導(dǎo)致內(nèi)容片面），只能依賴自身大模型訓練數(shù)據(jù)（導(dǎo)致信息滯后）。

3，效率與協(xié)作存在瓶頸。有些Agent處理跨領(lǐng)域復(fù)雜任務(wù)，非但耗時久還易卡殼，有些還無法與用戶現(xiàn)有工具（如文檔、云盤、專業(yè)軟件）無縫對接，儼然成了信息孤島。

說白了，是因為這些Agent太依賴單個模型能力和串行工作模式，難以應(yīng)對多任務(wù)并行、動態(tài)調(diào)整等需求。

▲市面上的大多數(shù)Agent都存在諸多能力的不足。

理論上講，Agent應(yīng)該像擁有超能力的AI管家，接到任務(wù)后會先畫思維導(dǎo)圖（規(guī)劃），再檢查步驟對不對（驗證），然后有條不紊地執(zhí)行。它長著數(shù)字眼睛，能“認路避障”（環(huán)境感知），帶著AI大腦，能權(quán)衡利弊（自主決策），揣著工具百寶箱，能“訂票叫車”（工具調(diào)用），還能有始有終（完成任務(wù)閉環(huán)）。

可太多Agent不是視障就是智障，可用性、穩(wěn)定性都不如人意。這就導(dǎo)致，企業(yè)將核心業(yè)務(wù)、重要任務(wù)交給Agent處理的意愿不足。

諸如此類的痛點，對應(yīng)的其實是行業(yè)的機會窗口。在Agent競速進入深水區(qū)的背景下，誰能率先解決可用性、穩(wěn)定性、資源整合等問題，誰就能在Agent時代建立起技術(shù)與生態(tài)的雙重壁壘，掌握定義行業(yè)標準的主動權(quán)。而GenFlow2.0的解決痛點導(dǎo)向，就來得很明晰。

跟時下那些只能跑在網(wǎng)頁或客戶端上，還得有邀請碼或內(nèi)測資格才能用的Agent有別，百度文庫GenFlow2.0有兩個典型特征：一是全端通用；二是現(xiàn)貨可用。

目前它已同步上線百度文庫網(wǎng)頁端、百度文庫APP，用戶無需排隊等待，就能開箱即用。

我在移動端試用時，發(fā)現(xiàn)它還有個很人性化的地方——將傳統(tǒng)“瀑布流”任務(wù)展示改為“并列式”進度可視化，我下達指令后，能直觀看到每個Agent的分工（如A Agent負責數(shù)據(jù)搜索、B Agent負責PPT生成）。

我體驗完后的內(nèi)心os是：百度該給產(chǎn)品經(jīng)理加雞腿了。比起滾動條沒完沒了地下拉，這樣操作才更切合普通用戶日常習慣吧？

值得注意的是，全球“首個全端通用Agent”并非GenFlow2.0的唯一優(yōu)點——它直接來了幾個行業(yè)首發(fā)，包括并行模式、記憶模式和全程可干預(yù)模式。

▲我使用GenFlow分析2024年至2025年Agent市場格局演變時，中途就暫停補充了新要求。

先說并行模式。我讓GenFlow2.0分析2025年Agent市場格局，生成對比表格并制作競品分析PPT，它會自動調(diào)度“市場分析Agent”“數(shù)據(jù)可視化Agent”“PPT生成Agent”“網(wǎng)盤檢索Agent”等多個專家級Agent并行工作，而非逐一處理。

據(jù)了解，GenFlow2.0依托百度文庫、網(wǎng)盤自研的Multi-Agent基礎(chǔ)架構(gòu)，可開啟“100+專家Agent并行處理”式的多智能體協(xié)同作戰(zhàn)，讓AI執(zhí)行任務(wù)從得慢慢等變成立等可取，實現(xiàn)了分鐘級交付（多項復(fù)雜任務(wù)3分鐘就可完成），提升了效率天花板。

再說記憶模式。我前幾天就讓GenFlow2.0幫我生成過Agent技術(shù)發(fā)展路徑分析，今天又要求它“分析2025年Agent市場格局”，它會自動調(diào)用歷史數(shù)據(jù)，無需再次闡述問題背景，避免重復(fù)勞動。

這背后是GenFlow2.0首創(chuàng)了“長-短-臨”三級記憶中樞，可在多輪任務(wù)中記住用戶對話、操作偏好、文件交互記錄、修改痕跡等，實現(xiàn)“越用越懂你”。

接著說全程可干預(yù)模式。我在GenFlow2.0生成內(nèi)容時，中途提出“加入2024年Agent市場格局情況”，它會立即調(diào)整，把我說的“聽”進去。

這也是文庫GenFlow2.0跟其他Agent的區(qū)別所在：一般Agent都是“寫 Prompt（提示詞）→漫長等待→發(fā)現(xiàn)不對→重寫 Prompt→新一輪等待”，它是“說一句→看著它干→隨時改→立等可取”，其實時干預(yù)功能允許用戶在任務(wù)流任何節(jié)點暫停、回退、補充指令或追加文件。

這些突破，顯然不只是單點技術(shù)升級。

AI技術(shù)進步固然不是線性化的，而是指數(shù)級的，但絕不會是平地起高樓。GenFlow2.0能攬下Agent領(lǐng)域的很多“首個”，離不開“專項積累+生態(tài)協(xié)同+全棧布局”三個維度的支撐。

從專項積累看，百度對Agent的探索早已形成累進式突破。

百度文庫中PPT、繪本、生圖、研究報告等單一Agent在垂直場景的成功，為滄舟OS和GenFlow1.0首次實現(xiàn)多Agent基礎(chǔ)調(diào)度做了鋪墊，也讓GenFlow2.0實現(xiàn)“從可用到好用”的跨越有了支點。

可以說，GenFlow2.0 的發(fā)布并非“從 0 到 1”，而是“從 100 到 1”——把上百個經(jīng)過市場驗證的成熟 Agent 裝進同一個“航母戰(zhàn)斗群”，“專項突破—系統(tǒng)整合—體驗升級”的路徑也由此成型。

從生態(tài)協(xié)同看，GenFlow2.0構(gòu)建起“百度自有生態(tài)+第三方合作生態(tài)”的雙循環(huán)。

在百度體系內(nèi)，它跟文庫網(wǎng)盤的“三庫（文庫公域?qū)I(yè)資料庫+經(jīng)用戶授權(quán)的網(wǎng)盤私域數(shù)據(jù)庫+用戶記憶庫）一平臺（百度學術(shù)平臺）三器（閱讀器、編輯器、播放器）”充分打通，跟蘿卜快跑（智能出行）、數(shù)字人直播（內(nèi)容創(chuàng)作）、秒噠（無代碼開發(fā)）等產(chǎn)品深度聯(lián)動。

你讓它生成“十一假期出游計劃”，系統(tǒng)可自動調(diào)用百度地圖生成可交互的行程H5，同步通過蘿卜快跑預(yù)約接送機服務(wù)。

▲FenFlow2.0離不開百度AI全棧布局的支撐，又跟百度其他AI產(chǎn)品形成了聯(lián)動。

在外部生態(tài)上，GenFlow2.0兼容MCP協(xié)議，榮耀 MagicOS 已原生接入，用戶可在手機負一屏一鍵調(diào)用其能力，實現(xiàn)“手機端生成PPT—平板端編輯—電腦端演示”的全場景流轉(zhuǎn)；WPS、釘釘、飛書也在灰度測試。

MCP協(xié)議的開放性，讓 GenFlow2.0 能像樂高積木那樣被嵌入任何應(yīng)用，讓其多重能力不再局限于單一應(yīng)用，而是滲透到用戶的生活與工作全場景中。

從全棧布局看，百度的全棧AI能力為GenFlow2.0提供了底部支撐。

從芯片層的昆侖芯（能提供算力支持），到框架層的飛槳（保障多Agent調(diào)度效率），再到模型層的文心大模型（有混合專家模型架構(gòu)、有多模態(tài)理解能力），百度是全球少數(shù)實現(xiàn)AI全棧自研的企業(yè)。全棧技術(shù)沉淀，托起了“端到端優(yōu)化”的閉環(huán)。

歷史不會重復(fù)，但總會押韻。二十多年前，Windows把DOS從命令行變成圖標；十多年前，iOS/Android把鍵盤變成觸控；而在今天，Agent又帶來了新人機交互方式與任務(wù)執(zhí)行模式。

接下來，誰能用兼具可用性、穩(wěn)定性的Agent產(chǎn)品更好地解決用戶需求、占領(lǐng)用戶心智，誰就能拿到下個十年的門票。

而今，GenFlow2.0就有了Android昔日的模樣：Android早些年就把硬件、應(yīng)用、服務(wù)統(tǒng)一在 Linux 內(nèi)核之上，形成了深厚生態(tài)壁壘，GenFlow2.0現(xiàn)在則是把算力、模型、數(shù)據(jù)、Agent、人統(tǒng)一在自然語言這個最樸素接口之上。

對用戶而言，當辦成很多任務(wù)只用一句語音而非復(fù)雜操作，那AI的實用價值也就能得到最大化發(fā)掘。這里的實用性，本是立足于對用戶需求的深刻洞悉，最終會落腳于對用戶體驗的深層革新。

▲AI Agent，最重要的是實用好用。

這類革新，既會形塑用戶對Agent的新期待，也會重塑中國在Agent領(lǐng)域的競爭力。

全球Agent競爭已陷入白熱化境地，硅谷巨頭們就在試圖將PC、移動互聯(lián)網(wǎng)時代的卡位優(yōu)勢復(fù)制到Agent中。

在此形勢下，GenFlow2.0多重突破的價值已超出技術(shù)升級本身，為國產(chǎn)AI在Agent領(lǐng)域?qū)崿F(xiàn)能力趕超、標準引領(lǐng)提供了參照系，也積攢了籌碼。

跟OpenAI的Agent生態(tài)側(cè)重于通用能力、微軟的側(cè)重于辦公體系不同，百度GenFlow2.0全端通用帶來的多場景無縫切換便利+公私域知識融合帶來的數(shù)據(jù)安全可控特點+并行處理、記憶可溯、全程可干預(yù)帶來的效率提升效果，證明了國產(chǎn)Agent可以有自己的創(chuàng)新引領(lǐng)點和差異化優(yōu)勢，具備變成跟OpenAI、微軟和谷歌們抗衡的全球生產(chǎn)力平臺。

可以預(yù)見，在不久的將來，超級好用的Agent在改變那塊名叫“AI應(yīng)用”的大洋地殼彈性后，AI的潮汐會以新節(jié)奏漫過每一道我們習以為常的堤岸。讓我們且看，且期待。

原文標題 : “最炫Agent風”正刮，誰能成為御風者？