學位論文 學術不端行為 檢測系統(簡稱“TMLC”)以《中國學術文獻網絡出版總庫》為全文比對數據庫,實現了對 抄襲 與剽竊、偽造、篡改等學術不端行為的快速檢測,可供用戶檢測學位論文,并支持用戶自建比對庫。 其系統示意圖如圖1所示。 TMLC 采用CNKI 自主研發的自適應多階 指紋 (AMLFP)特征檢測技術,具有檢測速度快,準確率,召回率較高,抗干擾性強等特征。
TMLC系統經過大規模數據測試后,針對中文學位論文中的不端文獻已經具有較好的檢測能力,達到了大規模實用的成熟程度。 鑒于中國學術不端文獻的實際情況,還需繼續開發能夠檢測英文學術不端文獻以及從英文翻譯為中文的不端文獻,同時比對數據庫應同時擴展到英文數據庫與互聯網文獻,事實數據庫也應同步擴展,并建立中英文對照的規范數據庫。
“學術不端文獻檢測系統”采用資源對比總庫,在組織結構上不僅突出知識的內在關聯,更形成了以文獻庫、概念知識元庫、學術趨勢庫、學者成果庫和專家評價庫為主題的特色資源庫,不僅針對不同的文檔類型和內容特征,支持從詞、句子到段落的數字指紋定義,并可對圖、表等特殊檢測對象進行基于標題、上下文、圖表內容結合的相似性檢測處理,還可根據特定的概念、觀點、結論等內容進行智能信息分類處理,實現語義級別內容的檢測。 可用于抄襲、偽造、一稿多投、篡改、不正當署名、一個成果多篇發表等多種學術不端行為的檢測。 該系統在高校學位論文審查方面的功能主要包括:已發表文獻檢測、論文實時在線檢測、問題庫查詢以及自建比對數據庫功能。