嗯,我從「文心一言」發(fā)布會(huì)回來了
不要完全相信截圖。
文 / 書航 2023.3.16
從我家到百度科技園,我單程需要跨越 66 公里,花費(fèi) 3 個(gè)小時(shí)。去現(xiàn)場參加發(fā)布會(huì)絕對不是第一時(shí)間領(lǐng)略「文心一言」魅力的最佳方案。
實(shí)際上,在現(xiàn)場可以看到的內(nèi)容,和直播的內(nèi)容基本一致。在現(xiàn)場能看到的也是錄屏演示,沒有額外「加餐」。
當(dāng)我回到家安頓下來再打開電腦,已經(jīng)有少量真實(shí)截圖,以及一個(gè)簡單的評測出來了。實(shí)際上,今晚開始確實(shí)有一批媒體會(huì)首先拿到邀請碼,推出相對簡單的評測。而未來幾天,預(yù)計(jì)會(huì)有更多人拿到邀請碼,相信也會(huì)有更深度的評測出現(xiàn)。
我觀察到一個(gè)挺有意思的現(xiàn)象,有一兩個(gè)微博上的娛樂營銷號,在發(fā)布會(huì)剛結(jié)束,就發(fā)布了相信是來自「文心一言」的截圖。另一些則是濫竽充數(shù),比如我看到有個(gè)博主說是「文心一言」的截圖,實(shí)際上來自另一款產(chǎn)品「寫作貓」。
這提醒了一個(gè)之前我沒有注意到的可能,就是對 AI 聊天畫面造假。例如有一張 ChatGPT 的問答,展示了它可以正確識別「文心一言邀請碼:KFCV50」這個(gè)段子的含義。然而我實(shí)際拿去測試了 GPT-3.5、GPT-4 和必應(yīng),結(jié)果是不論是否聯(lián)網(wǎng),圖里的回答都不可復(fù)現(xiàn)。
從技術(shù)上,對網(wǎng)頁截圖造假非常容易,只要打開瀏覽器的 F12 開發(fā)者工具就可以修改相應(yīng)段落,不需要 P 圖。作為對應(yīng),「文心一言」的界面樣式在發(fā)布會(huì)上已經(jīng)公布,而其真實(shí)的界面截圖都帶有唯一的浮水印。
差評做的評測也許是第一個(gè)完整的「文心一言」評測,其中測試了發(fā)布會(huì)沒提到的編程功能,以及以表格方式呈現(xiàn)結(jié)果。這說明「文心一言」的相關(guān)「涌現(xiàn)」能力其實(shí)已經(jīng)展露,但因?yàn)樗懔Σ罹鄶[在那里,不能預(yù)期它發(fā)揮跟 ChatGPT 一樣穩(wěn)定,出現(xiàn)不可控結(jié)果是完全有可能的。
在 ChatGPT 以及新必應(yīng)搜索剛剛引起社會(huì)關(guān)注時(shí),很多關(guān)于它「發(fā)瘋」或出現(xiàn)滑稽結(jié)果的報(bào)道,一度讓人懷疑它的實(shí)際能力。但當(dāng)大家逐漸用上之后,有些擔(dān)心自然而然地消失了。我覺得,一個(gè)對讀者有意義的評測,或許不應(yīng)該聚焦于如何讓生成式 AI 突破禁錮或「發(fā)瘋」,而是看它可不可以完成一些實(shí)際任務(wù),可以真正作為生產(chǎn)力工具使用。
至少目前已經(jīng)可以證明:這次發(fā)布的「文心一言」并不害怕真機(jī)評測。在發(fā)布會(huì)使用預(yù)錄視頻,或許只是想讓發(fā)布會(huì)的流程更順暢一些。
整場活動(dòng)大多都是演講,講的內(nèi)容或多或少之前都有線索可循。像我昨天預(yù)測的可能會(huì)用到百度自家的知識圖譜,結(jié)果今天發(fā)現(xiàn)果然如此,官方說法叫「知識增強(qiáng)」。而所有的發(fā)言其實(shí)都圍繞著一個(gè)目的,就是「預(yù)期管理」。
鑒于 OpenAI 的技術(shù)實(shí)力即使在硅谷范圍里也是遙遙領(lǐng)先,沒有任何理由要求「文心一言」剛發(fā)布就趕上乃至超越 ChatGPT。整場發(fā)布會(huì)的很多地方都希望大家能真實(shí)認(rèn)識到這一點(diǎn),正如我昨天所說:「跟 ChatGPT 比了不行是意料之中的,如果有地方勝出,那就是意外收獲!
另一個(gè)需要「管理」的預(yù)期,或許是「文心一言」的響應(yīng)速度。預(yù)錄視頻可以說明兩個(gè)問題:
「文心」大模型拆分 token(可以理解為不可拆分的最小生成單位)的方法可能和 GPT 不同。當(dāng)你留心觀察 ChatGPT 輸出答案的動(dòng)畫時(shí),可以發(fā)現(xiàn)它是一兩個(gè)詞這么往外「蹦」字,實(shí)際上代表了 token 在被消耗。而「文心一言」輸出答案則是非常流暢地從頭輸出到尾,這可能因?yàn)樗x擇了獲得全部回答之后才展現(xiàn)出來,也可能就是拆 token 的方法不一樣,單個(gè) token 意味著更長的字符串。
響應(yīng)速度肯定是理想狀態(tài),實(shí)際使用可能會(huì)慢一些,F(xiàn)在「文心一言」就沒幾個(gè)人用,即使過幾天估計(jì)也只是小范圍測試,所以這段時(shí)間的響應(yīng)都會(huì)很快。但不要忘記生成式 AI 時(shí)時(shí)刻刻都在消耗算力。今天下午,或許是因?yàn)檫M(jìn)不去「一言」就轉(zhuǎn)而測試「一格」的緣故,生成圖片的工具「文心一格」排隊(duì)速度比平時(shí)肉眼可見的減慢,似乎涌進(jìn)了更多的用戶。所以等輪到你用「文心一言」的時(shí)候,也有可能對百度的算力會(huì)提出一些挑戰(zhàn)。不過,百度本身有云服務(wù),而且曾經(jīng)服務(wù)過春晚這種超大型并發(fā),所以也或許到時(shí)候會(huì)優(yōu)化得比現(xiàn)在好很多。
所以,隨著發(fā)布會(huì)的進(jìn)行,百度股價(jià)跌一點(diǎn)是完全在預(yù)期之中的,甚至可以說「小跌算漲」。發(fā)布會(huì)采用錄播可能進(jìn)一步把當(dāng)天的股價(jià)壓了點(diǎn),但「文心一言」其實(shí)并不害怕就這樣接受實(shí)測。所以稍給一點(diǎn)時(shí)間,股價(jià)就有漲回來的空間。
美股開盤后,百度 ADR 走勢如下 ↓
最后,你問我能不能拿到邀請碼也做個(gè)評測?
我哪知道啊
題圖:使用「文心一言」作畫時(shí),它會(huì)讓你精準(zhǔn)給出 prompt,舉的例子是「幫我畫一枝晶瑩剔透的牡丹花」。我用「文心一格」畫了這個(gè) prompt。
原文標(biāo)題 : 嗯,我從「文心一言」發(fā)布會(huì)回來了

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
推薦專題