訂閱
糾錯
加入自媒體

Agent時代,大廠們「拆墻」又「筑墻」

文 | 劉詩雨 

編輯 | 孫靜 

向來以「克制」著稱的微信,終究是向外部Agent低了頭。

此前,用戶翹首以盼騰訊版「龍蝦」QClaw與WorkBuddy,重要原因之一便是只有它們可以通過微信調(diào)用。怎料微信選擇親自「拆墻」,推出「ClawBot」插件,接納包括OpenClaw在內(nèi)的一眾外部Agent。

一夜之間,技術(shù)平權(quán)了。

不過,微信目前向外部Agent開放的僅是消息通道,并未像飛書、釘釘?shù)绕髽I(yè)協(xié)作平臺一樣開放各種內(nèi)部能力——即便是騰訊版「龍蝦」也無法接觸微信聊天記錄、公眾號內(nèi)容等核心數(shù)據(jù)。

看來「權(quán)限與操作」的能力,只能盼望微信正在研發(fā)的內(nèi)部Agent來實現(xiàn)了。

放到更大視角來看,Agent時代,大廠這樣「拆墻」又「建墻」正在成為常態(tài),而第一批碰壁者已經(jīng)出現(xiàn)了。

01

Agent撞上「權(quán)限之墻」

最近,AI創(chuàng)業(yè)圈有個論調(diào):「MCP已死,CLI稱王!

原因是釘釘、飛書、企業(yè)微信等互聯(lián)網(wǎng)大廠們紛紛選擇開源了自家的CLI(命令行),而非MCP(模型上下文協(xié)議)。

▲MCP與CLI方案對比 圖源:COBUS GREYLING & AI

簡單說,CLI和MCP都是Agent與外部系統(tǒng)的「管道」。

不同于人類靠GUI(圖形用戶界面)與應用打交道,Agent可以通過「屏幕識別」和「模擬點擊」等方式來完成任務。但這種方式低效且極易被系統(tǒng)識別為「非真人操作」而禁止使用——這正是豆包手機助手遭遇的困境。

更講武德的方式是走API(應用程序接口),跳過繁瑣的圖形渲染,直接與應用后臺對話一一這就需要應用供應商授權(quán),而各家API接口協(xié)議不一樣,為了讓這種調(diào)用不各自為戰(zhàn),Anthropic推出MCP(Model ContextProtocol),是當前AI領(lǐng)域公認的統(tǒng)一接入標準,常被比作AI界的「type-C接口」。

換句話說:API 是業(yè)務能力,MCP 是 AI 接入業(yè)務能力的標準化插座。

而CLI算是「前朝遺老」,早期計算機交互的主要方式,用文字指令操作軟件,因為其結(jié)構(gòu)化、無冗余的特性,正在成為PC端Agent最順手的操作方式。

但無論是MCP、CLI,還是API,它們都只是調(diào)用方式——是工具層的問題,能否真正實現(xiàn),還要取決于雙方的意愿。

開放決定著「龍蝦」等Agent的技能上限。

目前來看,用戶并非每次指使「龍蝦」干活時都能找到解決方法,比如說「點外賣」「打車」這類基礎(chǔ)需求,在阿里的AI應用「千問」、美團的AI應用「小美」中可以輕易完成,「龍蝦」卻苦于權(quán)限問題只能干瞪眼。

▲千問和小美的辦事技能

而且「龍蝦」與「龍蝦」之間也有能力差異:阿里的B端AI應用 「悟空」將淘寶、天貓、1688、支付寶等阿里生態(tài)的B端能力統(tǒng)一封裝為可被AI直接調(diào)用的Skill和技能包;字節(jié)的ArkClaw深度集成飛書辦公套件,還能調(diào)用抖音、今日頭條的獨家插件,飛書也是OpenClaw官方默認的即時通訊(IM)應用;騰訊專注于打造「龍蝦天團」和上線「龍蝦池」SkillHub,暫未發(fā)現(xiàn)其Agent擁有獨家Skill。

在大洋彼岸,國外的AI御三家雖未跟風推出「龍蝦」產(chǎn)品,但也在逐步將「辦事」的能力集成到已有的產(chǎn)品中:在OpenAI撤回直接購物功能的同時,Gemini正嘗試幫用戶訂餐、買菜和打車(目前僅限于Pixel或三星手機的Gemini應用中),而Claude干脆像OpenClaw一樣可以自動操控用戶的電腦執(zhí)行任務。

▲三星在新機發(fā)布會上演示的谷歌 Gemini 任務自動化功能

很明顯,現(xiàn)階段Agent的能力上限,不僅與所用的大模型有關(guān),還取決于Agent的權(quán)限邊界。

面對Agent「敲門」,各家應用廠商們也是各懷心思。比如相同的搜索業(yè)務,百度大門敞開歡迎外部AI工具調(diào)用——在OpenClaw的官方技能商店 ClawHub上,百度搜索Skill下載量超4.5萬次;谷歌卻早早地刪除 num=100參數(shù),使得AI工具一次只能抓取前10個結(jié)果。

那么問題來了,面對外部Agent,為什么有人「拆墻」,有人「筑墻」?

02

墻的本質(zhì)是商業(yè)模式之爭

起初,Agent代理商們信奉著「用戶授權(quán),即可操作」的原則,試圖造出「AI大一統(tǒng)入口」。不過,現(xiàn)實很快給出了答案:墻,不是技術(shù)問題,而是利益問題。

在國內(nèi),家喻戶曉的沖突便是豆包手機助手與騰訊、阿里系應用之間的紛爭。前者與手機廠商合作,獲得硬件層面系統(tǒng)級的調(diào)度與操作應用的權(quán)限。結(jié)果上線幾天便被騰訊、阿里系應用封殺,銀行APP也彈出了風險提示。

在國外,典型案例便是亞馬遜起訴AI搜索公司Perplexity,前者指控后者的AI瀏覽器Comet偽裝成谷歌用戶訪問網(wǎng)站并完成購物流程,認為這是「欺詐」「違反使用條款」「危害用戶的數(shù)據(jù)安全」。

表面上看,豆包被封是風控問題,Perplexity被告是合規(guī)問題。但本質(zhì)指向同一個問題:當Agent替用戶完成操作時,平臺的價值鏈被截斷了。

Agent每替用戶完成一次操作,平臺就少了一次廣告曝光、一次數(shù)據(jù)采集、一次用戶觸達。Perplexity在反擊文章里指出:AI只是用戶的工具,企業(yè)無權(quán)干涉用戶如何使用自己的賬號;亞馬遜的真正意圖是把用戶數(shù)據(jù)牢牢握在手中,賣出更多廣告,是「霸凌者」。

▲Perplexity在博客更新《霸凌不是創(chuàng)新》,稱亞馬遜為「霸凌者」

2026年3月,美國地方法院裁定支持亞馬遜,后Perplexity提起上訴,請求撤銷或暫停執(zhí)行禁令,目前上訴法院暫時中止了該禁令。

這意味,在法律層面,Agent想要操作應用,尚未規(guī)定必須獲得用戶以及應用開發(fā)者的雙重授權(quán)。

目前,蘋果、小米、三星等硬件廠商在做Agent時都采用了「雙重授權(quán)」這一策略,通過系統(tǒng)級接口封裝和標準化協(xié)議,讓智能體在規(guī)范、可控的路徑下操作應用。

而軟件大廠們即是應用供應商,又是Agent代理商,是否為外部Agent「筑墻」取決于它的「命門」在哪兒。

比如同樣是電商平臺,亞馬遜和Shopify對待外部Agent的態(tài)度截然相反。亞馬遜不惜與Agent代理商打官司,Shopify則與Google、Walmart推出通用商業(yè)協(xié)議(UCP),主動給外部Agent開放標準化接口。

因為亞馬遜是平臺,賣流量;Shopify是服務商,賣交易。前者主要的盈利來源于廣告,依賴用戶在平臺上的每一次點擊與停留;而后者主要依靠促成交易抽傭,從商家GMV增長中實現(xiàn)增收。

對比中美兩國,大廠「筑墻」固然是商業(yè)本能,但墻的「高度」取決于生態(tài)結(jié)構(gòu)。美國平臺多為垂直分工、各守一方;中國的移動互聯(lián)網(wǎng)生態(tài)則由多個超級APP主導,大廠通過橫向擴張、縱向整合,把社交、支付、內(nèi)容、電商、本地生活等多項功能放進同一體系。

在這種結(jié)構(gòu)下,超級應用的「命門」不再是單一業(yè)務,而是整套用戶關(guān)系與數(shù)據(jù)。外部Agent一旦介入,沖擊的不只是廣告流量或一次交易,可能改變整個生態(tài)內(nèi)部的邏輯。這也使得國內(nèi)大廠對外部Agent的防御更為系統(tǒng)性。

此前就有某知名日用消費品集團的消費者體驗負責人告訴《降噪NoNoise》,他們在海外已經(jīng)看到一個品牌Agent可以實現(xiàn)跨平臺服務的案例,這是因為很多國外用戶習慣購物前先上Google搜索;但中國市場,線上購物場景分散、用戶的消費習慣是直接到各電商平臺站內(nèi)搜索,電商平臺也更注重把控站內(nèi)流量,所以很難出現(xiàn)一個品牌Agent跨平臺服務用戶。

站在品牌角度,該負責人認為,通過一個個品牌知識庫接入平臺Skill,是更現(xiàn)實的實現(xiàn)方式。

03

Agent的諸侯割據(jù)

在科幻電影里,賈維斯可以連接任意終端,操控斯塔克住宅的每一臺設備,還能調(diào)度鋼鐵戰(zhàn)甲內(nèi)部系統(tǒng)。但在現(xiàn)實的商業(yè)版圖中,這種跨平臺、跨終端的Agent「大一統(tǒng)」的幻想正在讓位于「諸侯割據(jù)」的現(xiàn)實。

可以判斷,在未來的很長一段時間內(nèi),中國很難出現(xiàn)代表「個人操作系統(tǒng)」的通用Agent,倒是平臺內(nèi)部的「統(tǒng)一入口」會加速成熟。

從國內(nèi)大廠的近期布局來看,這種趨勢日漸清晰。

阿里發(fā)力C端的千問錨定「AI辦事」,在集成購物、外賣、訂票等能力之后,又與自家的高德合作,提供AI「打車」服務;發(fā)力B端的「悟空」,用AI將自家的釘釘重做了一遍,并將阿里的to B能力統(tǒng)一放進去。

字節(jié)的豆包仍是中國第一大AI原生應用、也是字節(jié)C端規(guī)模最大的Agent。豆包與抖音、剪映、今日頭條等字節(jié)系應用深度打通,目前還在內(nèi)測購物功能。而吃到這波「龍蝦」很大一部分流量的飛書,也推出了AI助手aily,加速B端AI商業(yè)化。

▲飛書AI助手aily

騰訊則押注「龍蝦」全家桶,連「元寶派」里也可以創(chuàng)建龍蝦bot。在「龍蝦賽馬」的同時,騰訊內(nèi)部正在開發(fā)的專屬于微信場景的AI Agent,應該具有更大的想象力。

微信早已打通社交、內(nèi)容和支付三大場景,又通過小程序和視頻號發(fā)力電商,產(chǎn)品月活超過11億。在此基礎(chǔ)上,微信Agent計劃調(diào)用平臺內(nèi)數(shù)百萬個小程序,讓用戶在聊天框內(nèi)就能絲滑完成網(wǎng)約車、外賣、酒店預訂、生活繳費等全場景服務。這意味著,微信或?qū)⒛艹蔀锳I時代最高頻的超級入口。

百度已不再執(zhí)著于在應用端爭奪AI入口,而是側(cè)重于通過AI解決方案和大模型平臺調(diào)用,對外輸出AI能力。在「龍蝦潮」中,百度不僅端出全家桶,還將核心的百度搜索打造成OpenClaw官方技能商店上全球下載量最大的搜索Skill。

▲百度龍蝦全家桶

這一路徑選擇同樣基于現(xiàn)實:在這個字節(jié)、阿里與騰訊的年利潤動輒以千億計、AI資本開支同樣以千億計算的時代,百度不足200億元的利潤規(guī)模、十年千億元AI投入的處境,已經(jīng)被徹底擠出頭部陣營。

落到AI應用層,打造一款好用的通用AI助手需要在應用場景、用戶體驗、投入資源上無短板,但文心一言基本都不占優(yōu)勢。所以外界會看到,百度正收攏此前分散的入口,將文心助手深度集成于百度App,并加強百度文庫、網(wǎng)盤的資源投入,在B端則通過Token調(diào)用收費實現(xiàn)AI商業(yè)化。

這種戰(zhàn)略選擇有其合理性:當AI 迅速從「回答問題」走向「完成交易」,百度天然站在鏈路更靠后的位置,此時百度App可利用AI助手直接輸出整合后的答案,自然嵌入符合篩選條件的商業(yè)服務,如用戶搜機票后,可在搜索結(jié)果頁完成機票的比價、預訂、支付全流程。而百度此前的全棧AI投入亦可以在新到來的Token商業(yè)模式中發(fā)揮作用,因為自研芯片、框架與模型性能的配合度,將實際影響到每一個Token的價值高低。

在這些AI大廠之外,硬件廠商們也正在試圖通過系統(tǒng)級AI Agent,重新定義AI時代的交互入口。相比軟件大廠之間的劍拔弩張,掌握底層的硬件廠商們可能會有更多的跨應用、跨終端「辦事」的優(yōu)勢。

近日就有市場傳聞稱,豆包二代AI手機暫定今年第二季度上新,目前TOP5手機廠商有兩家在與豆包方面洽談。

至于更進一步的Agent to Agent協(xié)作——即賈維斯式的Agent,主流大廠短期內(nèi)不會放開這個口子,但注定會產(chǎn)生裂縫。

16世紀中葉,英國的一位剪絨工人發(fā)明了能夠「代替手工」的起毛機,效率高到讓同行恐慌。很快,英國國王就頒布了「起毛機禁令」。不過,隨著第一次工業(yè)革命的到來,新機器如潮水般涌入紡織業(yè),「起毛機禁令」也漸漸成了一紙空文。

「墻」,或許只能延緩沖擊到來的時間,卻無法阻止那個遲早會來的世界。

       原文標題 : Agent時代,大廠們「拆墻」又「筑墻」

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號