AI機(jī)器人喊出“中國臺(tái)灣省” 語音識(shí)別揭秘其愛國本源!
語義識(shí)別是聊天機(jī)器人的下一步
如果是臺(tái)灣的這款A(yù)I機(jī)器人說出“中國臺(tái)灣省”不過是基于語音庫作出的自然選擇,只能證明是聊天機(jī)器人在語音識(shí)別的階段的基本表現(xiàn)。那么,達(dá)到語義識(shí)別的聊天機(jī)器人又會(huì)有哪些表現(xiàn)呢?
在聊天機(jī)器人的背后,其實(shí)是一套復(fù)雜的系統(tǒng),主要包括5個(gè)功能模塊:語音識(shí)別模塊、自然語言理解模塊、對(duì)話管理模塊、自然語言生成模塊、語音合成模塊。
首先,語音識(shí)別模塊負(fù)責(zé)接收用戶輸入的語音并將其轉(zhuǎn)換成文字形式。
然后,自然語言理解模塊在理解了用戶輸入的語義之后將特定的語義表達(dá)式輸入到對(duì)話管理模塊中。
接著,對(duì)話管理模塊負(fù)責(zé)協(xié)調(diào)各個(gè)模塊的調(diào)用及維護(hù)當(dāng)前對(duì)話狀態(tài),選擇特定的回復(fù)方式并交由自然語言生成模塊進(jìn)行處理。
最后,自然語言生成模塊生成回復(fù)文本輸入給語音合成模塊將文字轉(zhuǎn)換成語音輸出給用戶。
通常來說,聊天機(jī)器人系統(tǒng)中的自然語言理解功能包括用戶意圖識(shí)別、用戶情感識(shí)別、指代消解、省略恢復(fù)、回復(fù)確認(rèn)及拒識(shí)判斷等技術(shù)。
對(duì)話管理功能主要協(xié)調(diào)聊天機(jī)器人的各個(gè)部分,并維護(hù)對(duì)話的結(jié)構(gòu)和狀態(tài)。對(duì)話管理功能中涉及到的關(guān)鍵技術(shù)主要有對(duì)話行為識(shí)別、對(duì)話狀態(tài)識(shí)別、對(duì)話策略學(xué)習(xí)及對(duì)話獎(jiǎng)勵(lì)等。
自然語言生成通常根據(jù)對(duì)話管理部分產(chǎn)生的非語言信息,自動(dòng)生成面向用戶的自然語言反饋。
目前來看,人類不過剛剛邁過了語音識(shí)別的門檻,甚至科大訊飛等公司中文的識(shí)別的準(zhǔn)確率提升到97%以上,但是機(jī)器人作出的反饋則是基于語音庫的自然連接,和被動(dòng)輸出已經(jīng)形成的答案。聊天機(jī)器人在現(xiàn)階段還做不到自己對(duì)聊天內(nèi)容理解基礎(chǔ)上的回答。曾經(jīng)因接受采訪而聲名鵲起的索菲亞機(jī)器人,后來被證明不過是通過后臺(tái)控制只能背誦標(biāo)準(zhǔn)答案的騙子。
點(diǎn)評(píng):聊天機(jī)器人不神秘也不神話,它不過是語音識(shí)別在智能機(jī)器人身上的一個(gè)應(yīng)用罷了。目前語音識(shí)別還難以突破語義理解的門檻,哪天人類在語義理解上突破了語義理解的瓶頸,讓機(jī)器人能真正聽懂人話,真正的AI機(jī)器人時(shí)代才會(huì)到來。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
推薦專題