學生或遭誤判作弊 AI檢測工具準確度惹爭議

  圖:AI檢測工具GPTZero雖然號稱「AI剋星」,但檢測結果依然存在誤判情況。\網絡圖片
  圖:AI檢測工具GPTZero雖然號稱「AI剋星」,但檢測結果依然存在誤判情況。\網絡圖片

  【大公報訊】據彭博社報道:在人工智能盛行的當下,AI工具對教育帶來了便利,也帶來了新的挑戰。如何識別學生是否有使用AI,是否存在抄襲等學術不端行為,教育界仍在摸索。

  AI檢測工具通常會藉文本的複雜度和變化的多元程度,來判斷文章是否由AI生成,這導致寫作風格更固定模式化的學生,包括英語作為第二語言的學生,更容易面臨被AI檢測工具誤判的情況。

  彭博社使用了500篇大學入學申請文書,對兩款知名AI檢測工具「GPTZero」和「Copyleaks」進行測試,這些文書確認由真人撰寫。結果顯示,兩款AI檢測工具,錯誤地將1%到2%的文件標記為可能由AI撰寫。彭博社還使用GPTZero來檢測一篇由人類撰寫的論文,GPTZero先錯誤地將其判定為98.1%概率是由AI生成,但使用了可將文章修改成更像人類寫作的風格的工具「Hix Bypass」修改後,GPTZero判論文是由AI生成的機率大幅降至5.3%。

  史丹福大學的研究發現,AI檢測工具在檢查美國八年級學生的作文時,準確度「近乎完美」,但在檢查非英語母語學生的作文時,卻將超過一半的作文標記為AI生成。由於作業被誤判的可能性存在,大學生們現在會採取各種措施來證明自己作品為原創,例如視頻記錄寫作過程、使用Google文件以便教師查閱修改紀錄,甚至耗費大量心力改變措辭。

  也有專家認為,教育工作者也應該增加對AI的認識,引導學生將AI當作學習的輔助工具,而非一項威脅。