訂閱
糾錯(cuò)
加入自媒體

“最炫Agent風(fēng)”正刮,誰(shuí)能成為御風(fēng)者?

 

文 | 佘宗明

 

PC互聯(lián)網(wǎng)時(shí)代的技術(shù)主要呈現(xiàn)界面是Web(網(wǎng)頁(yè)),移動(dòng)互聯(lián)網(wǎng)時(shí)代的是App(客戶端),那AI時(shí)代的呢?

比爾·蓋茨兩年前的預(yù)言,就給出了答案:AI Agent將是AI最大的賽道,“Agent(智能體)不僅將改變?nèi)藗兣c計(jì)算機(jī)的互動(dòng)方式,還將顛覆軟件行業(yè),引發(fā)自鍵入命令到點(diǎn)擊圖標(biāo)以來(lái)計(jì)算機(jī)領(lǐng)域最大的革命。”

如果說(shuō)彼時(shí)他的這番斷言還有些超前,那如今“AI Agent時(shí)代已來(lái)”漸成共識(shí)的現(xiàn)實(shí),就是跟他打了個(gè)響指。

3個(gè)月前,微軟CEO納德拉就在微軟2025年Build大會(huì)上表示:“我們已經(jīng)進(jìn)入了AI Agent時(shí)代,正在見(jiàn)證AI系統(tǒng)如何以全新方式幫助我們解決問(wèn)題。”

有意思的是,當(dāng)時(shí)還跟納德拉進(jìn)行了連線的馬斯克,旗下AI公司xAI前不久還準(zhǔn)備籌建名字內(nèi)涵微軟(Microsoft)的子公司巨硬(MacroHard),定位于打造AI Agent生態(tài)。

在硅谷掀起“最炫Agent風(fēng)”之際,大洋彼岸的中國(guó)科技企業(yè)也正以前瞻的技術(shù)布局與獨(dú)特的技術(shù)路徑,在這場(chǎng)決定未來(lái)若干年AI應(yīng)用生態(tài)格局的賽道上積極卡位,努力將身位從追趕者變?yōu)轭I(lǐng)跑者。

01

回顧現(xiàn)代技術(shù)演進(jìn)史,技術(shù)發(fā)展總是遵循著“技術(shù)突破-產(chǎn)業(yè)聚焦-場(chǎng)景落地”的路徑,AI也不例外。

2023年初,ChatGPT出圈揭開(kāi)了AI大模型軍備競(jìng)賽的序幕,兩年多過(guò)去了,在“Agent元年”說(shuō)法的掩映下,全球科技巨頭競(jìng)爭(zhēng)焦點(diǎn)正從大模型參數(shù)轉(zhuǎn)向Agent。

原因很簡(jiǎn)單:隨著大模型參數(shù)規(guī)模擴(kuò)大帶來(lái)的邊際效益遞減,如何讓AI從“被動(dòng)響應(yīng)工具”變成“主動(dòng)規(guī)劃執(zhí)行者”,已成行業(yè)新命題。而Agent就是AI從“感知智能”邁向“認(rèn)知智能”的關(guān)鍵載體,也是連接大模型技術(shù)與真實(shí)場(chǎng)景的核心橋梁。

作為能自主理解任務(wù)、規(guī)劃步驟、調(diào)用工具的AI應(yīng)用形態(tài),Agent可以讓AI不再是孤立的技術(shù)模塊,而是能深度嵌入企業(yè)運(yùn)營(yíng)系統(tǒng)的“生產(chǎn)力單元”,解決傳統(tǒng)AI應(yīng)用場(chǎng)景碎片化、投入產(chǎn)出比低等問(wèn)題,推動(dòng)AI技術(shù)在產(chǎn)業(yè)側(cè)的應(yīng)用落地。

在硅谷,OpenAI在GPT-4之后,迅速推出GPT-4o Agent,試圖通過(guò)連接代碼解釋器、網(wǎng)頁(yè)瀏覽器等工具,打破大模型“只能對(duì)話不能行動(dòng)”的局限;微軟則將Copilot深度集成于Windows系統(tǒng)與Office全家桶,提出“Agent for Everyone”戰(zhàn)略;谷歌則押注“多智能體協(xié)作”,發(fā)布了Gemini Agent Suite。

▲國(guó)內(nèi)外科技巨頭們都在發(fā)力AI Agent。

在國(guó)內(nèi),科技企業(yè)也在加碼發(fā)力。動(dòng)作最大的,要數(shù)百度:從2024年發(fā)布文心智能體平臺(tái)AgentBuilder,到今年4月推出全球首個(gè)內(nèi)容操作系統(tǒng)“滄舟OS”、先發(fā)在行業(yè)內(nèi)率先實(shí)現(xiàn)全場(chǎng)景滿足、全鏈路覆蓋的AI Agent GenFlow1.0、上線通用超級(jí)智能體App心響,百度在Agent賽道的深耕軌跡清晰可見(jiàn)。

8月18日的百度AIDAY上,百度文庫(kù)與百度網(wǎng)盤(pán)又聯(lián)合發(fā)布了全球首個(gè)全端通用AI Agent GenFlow2.0,以“全端通用”“并行任務(wù)”“記憶可溯”等突破性進(jìn)展,為國(guó)產(chǎn)AI在全球Agent領(lǐng)域的競(jìng)爭(zhēng)注入了強(qiáng)勁動(dòng)力。

這極具默契的轉(zhuǎn)向背后,是AI產(chǎn)業(yè)對(duì)AI價(jià)值的認(rèn)知再校準(zhǔn):AI的價(jià)值不在于炫技,而在于應(yīng)用。AI時(shí)代,企業(yè)需要的是能自動(dòng)生成財(cái)報(bào)、拆解項(xiàng)目計(jì)劃的AI助手,個(gè)人需要的是能同步處理郵件、整理資料的AI助力,這些都在倒逼AI從“能說(shuō)會(huì)道”向“能做會(huì)干”進(jìn)化。

02

盡管被寄予厚望之下,AI Agent迎來(lái)了爆發(fā)之勢(shì),但不得不說(shuō),當(dāng)前行業(yè)仍面臨著理想與現(xiàn)實(shí)的鴻溝:市面上多數(shù)Agent產(chǎn)品還停留在“單輪對(duì)話+插件”階段,并沒(méi)邁過(guò)從實(shí)驗(yàn)室玩具到生產(chǎn)力工具的那道門(mén)檻。

今年4月,Gartner就發(fā)布報(bào)告稱,市場(chǎng)上正充斥著所謂的“智能體洗牌”現(xiàn)象,即廠商將普通AI助手或ChatBot重新包裝為“智能體”,但這些產(chǎn)品實(shí)際缺乏真正的自主智能能力。

揆諸現(xiàn)實(shí),當(dāng)下很多Agent跟用戶現(xiàn)實(shí)期待仍有不小差距,這具體反映在幾個(gè)方面:

1,任務(wù)拆解能力不足。許多Agent在處理復(fù)雜任務(wù)時(shí),會(huì)出現(xiàn)邏輯斷裂。

你讓它“生成新能源汽車市場(chǎng)季度分析報(bào)告,需包含政策分析、競(jìng)品數(shù)據(jù)和趨勢(shì)預(yù)測(cè)”,它可能要么遺漏“政策分析”等關(guān)鍵模塊,要么將“競(jìng)品數(shù)據(jù)”局限于單一品牌,最終產(chǎn)出的結(jié)果經(jīng)常需要人工大幅修改。

這是因?yàn)楫?dāng)前很多Agent的任務(wù)規(guī)劃算法仍依賴簡(jiǎn)單的規(guī)則匹配,缺乏對(duì)復(fù)雜需求的深度理解與動(dòng)態(tài)調(diào)整能力,無(wú)法像人那樣將復(fù)雜目標(biāo)拆解為“數(shù)據(jù)采集—分析建模—內(nèi)容生成—格式轉(zhuǎn)換”等有序子任務(wù)。

2,結(jié)果質(zhì)量不可控。不少Agent生成的內(nèi)容,動(dòng)輒存在低級(jí)錯(cuò)誤。

我曾用某教育類Agent幫我生成講座課件,結(jié)果PPT中出現(xiàn)了“媒介即訊息是尼爾·波茲曼提出”的結(jié)論。

根源在于,這些Agent缺乏專業(yè)知識(shí)庫(kù),無(wú)法安全訪問(wèn)私域資源(導(dǎo)致內(nèi)容片面),只能依賴自身大模型訓(xùn)練數(shù)據(jù)(導(dǎo)致信息滯后)。

3,效率與協(xié)作存在瓶頸。有些Agent處理跨領(lǐng)域復(fù)雜任務(wù),非但耗時(shí)久還易卡殼,有些還無(wú)法與用戶現(xiàn)有工具(如文檔、云盤(pán)、專業(yè)軟件)無(wú)縫對(duì)接,儼然成了信息孤島。

說(shuō)白了,是因?yàn)檫@些Agent太依賴單個(gè)模型能力和串行工作模式,難以應(yīng)對(duì)多任務(wù)并行、動(dòng)態(tài)調(diào)整等需求。

▲市面上的大多數(shù)Agent都存在諸多能力的不足。

理論上講,Agent應(yīng)該像擁有超能力的AI管家,接到任務(wù)后會(huì)先畫(huà)思維導(dǎo)圖(規(guī)劃),再檢查步驟對(duì)不對(duì)(驗(yàn)證),然后有條不紊地執(zhí)行。它長(zhǎng)著數(shù)字眼睛,能“認(rèn)路避障”(環(huán)境感知),帶著AI大腦,能權(quán)衡利弊(自主決策),揣著工具百寶箱,能“訂票叫車”(工具調(diào)用),還能有始有終(完成任務(wù)閉環(huán))。

可太多Agent不是視障就是智障,可用性、穩(wěn)定性都不如人意。這就導(dǎo)致,企業(yè)將核心業(yè)務(wù)、重要任務(wù)交給Agent處理的意愿不足。

諸如此類的痛點(diǎn),對(duì)應(yīng)的其實(shí)是行業(yè)的機(jī)會(huì)窗口。在Agent競(jìng)速進(jìn)入深水區(qū)的背景下,誰(shuí)能率先解決可用性、穩(wěn)定性、資源整合等問(wèn)題,誰(shuí)就能在Agent時(shí)代建立起技術(shù)與生態(tài)的雙重壁壘,掌握定義行業(yè)標(biāo)準(zhǔn)的主動(dòng)權(quán)。而GenFlow2.0的解決痛點(diǎn)導(dǎo)向,就來(lái)得很明晰。

03

跟時(shí)下那些只能跑在網(wǎng)頁(yè)或客戶端上,還得有邀請(qǐng)碼或內(nèi)測(cè)資格才能用的Agent有別,百度文庫(kù)GenFlow2.0有兩個(gè)典型特征:一是全端通用;二是現(xiàn)貨可用。

目前它已同步上線百度文庫(kù)網(wǎng)頁(yè)端、百度文庫(kù)APP,用戶無(wú)需排隊(duì)等待,就能開(kāi)箱即用。

我在移動(dòng)端試用時(shí),發(fā)現(xiàn)它還有個(gè)很人性化的地方——將傳統(tǒng)“瀑布流”任務(wù)展示改為“并列式”進(jìn)度可視化,我下達(dá)指令后,能直觀看到每個(gè)Agent的分工(如A Agent負(fù)責(zé)數(shù)據(jù)搜索、B Agent負(fù)責(zé)PPT生成)。

我體驗(yàn)完后的內(nèi)心os是:百度該給產(chǎn)品經(jīng)理加雞腿了。比起滾動(dòng)條沒(méi)完沒(méi)了地下拉,這樣操作才更切合普通用戶日常習(xí)慣吧?

值得注意的是,全球“首個(gè)全端通用Agent”并非GenFlow2.0的唯一優(yōu)點(diǎn)——它直接來(lái)了幾個(gè)行業(yè)首發(fā),包括并行模式、記憶模式和全程可干預(yù)模式。

▲我使用GenFlow分析2024年至2025年Agent市場(chǎng)格局演變時(shí),中途就暫停補(bǔ)充了新要求。

先說(shuō)并行模式。我讓GenFlow2.0分析2025年Agent市場(chǎng)格局,生成對(duì)比表格并制作競(jìng)品分析PPT,它會(huì)自動(dòng)調(diào)度“市場(chǎng)分析Agent”“數(shù)據(jù)可視化Agent”“PPT生成Agent”“網(wǎng)盤(pán)檢索Agent”等多個(gè)專家級(jí)Agent并行工作,而非逐一處理。

據(jù)了解,GenFlow2.0依托百度文庫(kù)、網(wǎng)盤(pán)自研的Multi-Agent基礎(chǔ)架構(gòu),可開(kāi)啟“100+專家Agent并行處理”式的多智能體協(xié)同作戰(zhàn),讓AI執(zhí)行任務(wù)從得慢慢等變成立等可取,實(shí)現(xiàn)了分鐘級(jí)交付(多項(xiàng)復(fù)雜任務(wù)3分鐘就可完成),提升了效率天花板。

再說(shuō)記憶模式。我前幾天就讓GenFlow2.0幫我生成過(guò)Agent技術(shù)發(fā)展路徑分析,今天又要求它“分析2025年Agent市場(chǎng)格局”,它會(huì)自動(dòng)調(diào)用歷史數(shù)據(jù),無(wú)需再次闡述問(wèn)題背景,避免重復(fù)勞動(dòng)。

這背后是GenFlow2.0首創(chuàng)了“長(zhǎng)-短-臨”三級(jí)記憶中樞,可在多輪任務(wù)中記住用戶對(duì)話、操作偏好、文件交互記錄、修改痕跡等,實(shí)現(xiàn)“越用越懂你”。

接著說(shuō)全程可干預(yù)模式。我在GenFlow2.0生成內(nèi)容時(shí),中途提出“加入2024年Agent市場(chǎng)格局情況”,它會(huì)立即調(diào)整,把我說(shuō)的“聽(tīng)”進(jìn)去。

這也是文庫(kù)GenFlow2.0跟其他Agent的區(qū)別所在:一般Agent都是“寫(xiě) Prompt(提示詞)→漫長(zhǎng)等待→發(fā)現(xiàn)不對(duì)→重寫(xiě) Prompt→新一輪等待”,它是“說(shuō)一句→看著它干→隨時(shí)改→立等可取”,其實(shí)時(shí)干預(yù)功能允許用戶在任務(wù)流任何節(jié)點(diǎn)暫停、回退、補(bǔ)充指令或追加文件。

這些突破,顯然不只是單點(diǎn)技術(shù)升級(jí)。

04

AI技術(shù)進(jìn)步固然不是線性化的,而是指數(shù)級(jí)的,但絕不會(huì)是平地起高樓。GenFlow2.0能攬下Agent領(lǐng)域的很多“首個(gè)”,離不開(kāi)“專項(xiàng)積累+生態(tài)協(xié)同+全棧布局”三個(gè)維度的支撐。

從專項(xiàng)積累看,百度對(duì)Agent的探索早已形成累進(jìn)式突破。

百度文庫(kù)中PPT、繪本、生圖、研究報(bào)告等單一Agent在垂直場(chǎng)景的成功,為滄舟OS和GenFlow1.0首次實(shí)現(xiàn)多Agent基礎(chǔ)調(diào)度做了鋪墊,也讓GenFlow2.0實(shí)現(xiàn)“從可用到好用”的跨越有了支點(diǎn)。

可以說(shuō),GenFlow2.0 的發(fā)布并非“從 0 到 1”,而是“從 100 到 1”——把上百個(gè)經(jīng)過(guò)市場(chǎng)驗(yàn)證的成熟 Agent 裝進(jìn)同一個(gè)“航母戰(zhàn)斗群”,“專項(xiàng)突破—系統(tǒng)整合—體驗(yàn)升級(jí)”的路徑也由此成型。

從生態(tài)協(xié)同看,GenFlow2.0構(gòu)建起“百度自有生態(tài)+第三方合作生態(tài)”的雙循環(huán)。

在百度體系內(nèi),它跟文庫(kù)網(wǎng)盤(pán)的“三庫(kù)(文庫(kù)公域?qū)I(yè)資料庫(kù)+經(jīng)用戶授權(quán)的網(wǎng)盤(pán)私域數(shù)據(jù)庫(kù)+用戶記憶庫(kù))一平臺(tái)(百度學(xué)術(shù)平臺(tái))三器(閱讀器、編輯器、播放器)”充分打通,跟蘿卜快跑(智能出行)、數(shù)字人直播(內(nèi)容創(chuàng)作)、秒噠(無(wú)代碼開(kāi)發(fā))等產(chǎn)品深度聯(lián)動(dòng)。

你讓它生成“十一假期出游計(jì)劃”,系統(tǒng)可自動(dòng)調(diào)用百度地圖生成可交互的行程H5,同步通過(guò)蘿卜快跑預(yù)約接送機(jī)服務(wù)。

▲FenFlow2.0離不開(kāi)百度AI全棧布局的支撐,又跟百度其他AI產(chǎn)品形成了聯(lián)動(dòng)。

在外部生態(tài)上,GenFlow2.0兼容MCP協(xié)議,榮耀 MagicOS 已原生接入,用戶可在手機(jī)負(fù)一屏一鍵調(diào)用其能力,實(shí)現(xiàn)“手機(jī)端生成PPT—平板端編輯—電腦端演示”的全場(chǎng)景流轉(zhuǎn);WPS、釘釘、飛書(shū)也在灰度測(cè)試。

MCP協(xié)議的開(kāi)放性,讓 GenFlow2.0 能像樂(lè)高積木那樣被嵌入任何應(yīng)用,讓其多重能力不再局限于單一應(yīng)用,而是滲透到用戶的生活與工作全場(chǎng)景中。

從全棧布局看,百度的全棧AI能力為GenFlow2.0提供了底部支撐。

從芯片層的昆侖芯(能提供算力支持),到框架層的飛槳(保障多Agent調(diào)度效率),再到模型層的文心大模型(有混合專家模型架構(gòu)、有多模態(tài)理解能力),百度是全球少數(shù)實(shí)現(xiàn)AI全棧自研的企業(yè)。全棧技術(shù)沉淀,托起了“端到端優(yōu)化”的閉環(huán)。

05

歷史不會(huì)重復(fù),但總會(huì)押韻。二十多年前,Windows把DOS從命令行變成圖標(biāo);十多年前,iOS/Android把鍵盤(pán)變成觸控;而在今天,Agent又帶來(lái)了新人機(jī)交互方式與任務(wù)執(zhí)行模式。

接下來(lái),誰(shuí)能用兼具可用性、穩(wěn)定性的Agent產(chǎn)品更好地解決用戶需求、占領(lǐng)用戶心智,誰(shuí)就能拿到下個(gè)十年的門(mén)票。

而今,GenFlow2.0就有了Android昔日的模樣:Android早些年就把硬件、應(yīng)用、服務(wù)統(tǒng)一在 Linux 內(nèi)核之上,形成了深厚生態(tài)壁壘,GenFlow2.0現(xiàn)在則是把算力、模型、數(shù)據(jù)、Agent、人統(tǒng)一在自然語(yǔ)言這個(gè)最樸素接口之上。

對(duì)用戶而言,當(dāng)辦成很多任務(wù)只用一句語(yǔ)音而非復(fù)雜操作,那AI的實(shí)用價(jià)值也就能得到最大化發(fā)掘。這里的實(shí)用性,本是立足于對(duì)用戶需求的深刻洞悉,最終會(huì)落腳于對(duì)用戶體驗(yàn)的深層革新。

▲AI Agent,最重要的是實(shí)用好用。

這類革新,既會(huì)形塑用戶對(duì)Agent的新期待,也會(huì)重塑中國(guó)在Agent領(lǐng)域的競(jìng)爭(zhēng)力。

全球Agent競(jìng)爭(zhēng)已陷入白熱化境地,硅谷巨頭們就在試圖將PC、移動(dòng)互聯(lián)網(wǎng)時(shí)代的卡位優(yōu)勢(shì)復(fù)制到Agent中。

在此形勢(shì)下,GenFlow2.0多重突破的價(jià)值已超出技術(shù)升級(jí)本身,為國(guó)產(chǎn)AI在Agent領(lǐng)域?qū)崿F(xiàn)能力趕超、標(biāo)準(zhǔn)引領(lǐng)提供了參照系,也積攢了籌碼。

跟OpenAI的Agent生態(tài)側(cè)重于通用能力、微軟的側(cè)重于辦公體系不同,百度GenFlow2.0全端通用帶來(lái)的多場(chǎng)景無(wú)縫切換便利+公私域知識(shí)融合帶來(lái)的數(shù)據(jù)安全可控特點(diǎn)+并行處理、記憶可溯、全程可干預(yù)帶來(lái)的效率提升效果,證明了國(guó)產(chǎn)Agent可以有自己的創(chuàng)新引領(lǐng)點(diǎn)和差異化優(yōu)勢(shì),具備變成跟OpenAI、微軟和谷歌們抗衡的全球生產(chǎn)力平臺(tái)。

可以預(yù)見(jiàn),在不久的將來(lái),超級(jí)好用的Agent在改變那塊名叫“AI應(yīng)用”的大洋地殼彈性后,AI的潮汐會(huì)以新節(jié)奏漫過(guò)每一道我們習(xí)以為常的堤岸。讓我們且看,且期待。

       原文標(biāo)題 : “最炫Agent風(fēng)”正刮,誰(shuí)能成為御風(fēng)者?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)