卡內(nèi)基梅隆大學(xué)開(kāi)發(fā)AI屆的“歐亨利”,能斬獲普利策獎(jiǎng)嗎?
高級(jí)的自然語(yǔ)言處理系統(tǒng),比如OpenAI的GPT-2,可以寫出人性化的語(yǔ)言,這一點(diǎn)令人印象深刻。然而,這樣的人工智能的語(yǔ)言往往缺乏說(shuō)服力和連貫性。其最顯著的特點(diǎn)就是他們難以寫出令人信服的作品——人工智能生成的故事往往是通用的,缺乏上下文。
為解決這一問(wèn)題,卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院的科學(xué)家們?cè)O(shè)計(jì)出一種方法,即為一個(gè)給定的故事創(chuàng)造更多“多樣化”的結(jié)尾。他們表示,研究的關(guān)鍵是訓(xùn)練人工模型把注意力集中在故事的重要短語(yǔ)上,促進(jìn)非通用詞的生成。
“故事情境由連接人物和事件的一系列句子構(gòu)成。這項(xiàng)任務(wù)具有挑戰(zhàn)性,因?yàn)樗枰獙?duì)上下文中的角色,事件和對(duì)象進(jìn)行建模,然后根據(jù)它們生成連貫且合理的結(jié)尾。概括事件和實(shí)體的語(yǔ)義以及它們?cè)诓煌适轮械年P(guān)系是一項(xiàng)非常重要的任務(wù),”合著者寫道,“我們的研究表明,兩者的結(jié)合會(huì)帶來(lái)更多樣、更有趣的結(jié)局!
團(tuán)隊(duì)利用seq2seq模型(一種長(zhǎng)短期記憶遞歸神經(jīng)網(wǎng)絡(luò)架構(gòu),能夠?qū)W習(xí)依賴關(guān)系),并創(chuàng)建符合目標(biāo)故事情境的文字的數(shù)學(xué)表示,學(xué)習(xí)這些文字之間的關(guān)系,將他們轉(zhuǎn)化為人類可讀的文本。為了整合故事上下文中的關(guān)鍵短語(yǔ),研究人員使用了一種名為RAKE的算法,該算法根據(jù)單詞的出現(xiàn)頻率和共現(xiàn)度為短語(yǔ)分配分?jǐn)?shù),然后根據(jù)相應(yīng)的分?jǐn)?shù)對(duì)短語(yǔ)進(jìn)行手動(dòng)排序,并將低于一定閾值的短語(yǔ)丟棄。
為了使模型能夠生成更豐富的結(jié)尾,科學(xué)家們通過(guò)ROCStories數(shù)據(jù)集升級(jí)了他們的模型,該數(shù)據(jù)集包含超過(guò)50,000個(gè)五句話的故事。為了評(píng)估該模型,他們使用DIST算法計(jì)算得出不重復(fù)的一元模型(來(lái)自給定文本或語(yǔ)音樣本的n個(gè)項(xiàng)目的連續(xù)序列)、二元模型(一對(duì)連續(xù)寫單位如字母、音節(jié),或文字)和三元模型(三個(gè)連續(xù)寫單位)的數(shù)量,并將它們與一元、二元和三元模型的總數(shù)量相除。
在另一項(xiàng)測(cè)試中,他們訓(xùn)練谷歌的BERT完成開(kāi)源故事填空任務(wù),讓BERT在給定兩個(gè)選項(xiàng)的情況下選擇正確的故事結(jié)尾,從而將模型與基線進(jìn)行比較。
那么人工智能的表現(xiàn)如何呢?顯然想拿到普利策獎(jiǎng)是不可能了。雖然它在DIST測(cè)試中名列前茅,且故事完形填空的正確率達(dá)到了72%,但它偶爾也會(huì)給出一些荒謬的結(jié)尾,比如“凱蒂被自己搞得崩潰了,甩了男友”,或者不正確的代詞(“凱蒂”、“他自己”)。
研究人員承認(rèn),需要進(jìn)一步的研究來(lái)確保輸出“語(yǔ)義和象征層面上的上下文”,并且它們?cè)谶壿嬌鲜呛侠砗鸵恢碌摹1M管如此,他們聲稱他們已經(jīng)“定量地”和“定性地”表明他們的模型能夠超越基線,實(shí)現(xiàn)“有意義的”改進(jìn)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 3 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 4 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 5 2025年8月人工智能投融資觀察
- 6 7 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 8 Manus跑路,大廠掉線,只能靠DeepSeek了
- 9 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 10 地平線的野心:1000萬(wàn)套HSD上車