123,123,123

200字作文尋出8處錯誤 AI閱卷是否靠譜？

2017-12-07 10:53

　　近日，來自俄羅斯、韓國、贊比亞等國家的11位外國留學生完成了一份特別的中文試卷，之所以稱其特別，原因是這份中文試卷不是由老師批改，而是由AI進行評判。這批考生也成為了全球首批接受AI閱卷的學生。

　　200字作文尋出8處錯誤

　　考試前，老師給他們布置了一道作文題，名為“請寫一寫你的愛好”。半小時的寫作時間結束后，就輪到AI工作了。不過AI也不是直接就能對試卷進行評判，首先還是得先將試卷掃描，將掃描圖像轉化成文字之后顯示在電腦上，幾十秒不到，就見AI在一篇200字不到的作文里尋得了8個錯誤。

　�。▓D片源自微博）

　　在這份作文里，我們可以看到，在“但中文的難點并非是字，而且像女朋友一樣善變”這句話中，AI將Redundant（多詞）標記在了“是”字下方，將Selection（錯詞）標記在了“而且”下方。此外，Missing（缺詞）和Word Order（語序錯誤）等錯誤，也被AI逐一標記在了文中對應位置。

　　據了解，這款AI來自阿里巴巴，將AI應用到外國人學中文試卷批改上，也是全球首例。在擁有評閱試卷的能力之前，這款AI需先經歷大量的中文語言體系學習，通過掃描儀掃描完卷面信息，使用OCR技術將其轉換成文本之后，AI再通過自然語言處理算法對文章內容進行分析，并識別出錯位類型和位置，最后批注在卷面上。從目前的測試情況來看，這款AI在準確率方面都接近甚至超越人類的水平。

　　AI閱卷是否靠譜？

　　通常，考試的試卷中都包含主觀題和客觀題兩部分。其中，AI參與客觀題的評判比較常見，客觀題一般都有標準答案，將考生的答案和事先存儲的標準答案進行比對，得出對錯，這是極其簡單的過程。

　　較高級的AI則可以在判斷對錯之后，對選項做出一定解釋，讓考生明白自己的選擇對錯及原因。除此之外，將所有考生的客觀題答案集合起來，對每道題目的得分率、各選項選擇率等進行綜合分析，則是更為高級的AI，這就涉及到數據分析的層面。

　　目前，用AI來評判客觀題正誤的模式，已被大多數人認可，一方面提高了閱卷效率，另一方面保證了閱卷質量。那用AI來評判主觀題的好壞，又將如何？

1 2 下一頁>