論文查重的檢測原理是什么?查重系統事先根據換行符把文章切分成段落,然后再根據標點符號把段落切分成句子,再把每個句子分別進行查重檢測。論文的查重粒度是句子,兩個句子的相似度主要取決于句子包含哪些詞,以及詞在句子中的位置。
目前句子相似度只有文字上的對比,不考慮語義上的相近。如果做到語義上的查重,那我們就沒法改重了。總體相似度=相似字數/檢測字,被系統自動識別出來的非正文部分(如目錄,標題,公式,圖表,參考文獻等)不參與檢測,檢測字數一般略小于論文字數。
相似字數=(句子1字數*句子1相似度+句子2字數*句子2相似度+……+句子n字數*句子n相似度),句子相似度范圍0.00~1.00,綠色句子相似度按照0計算。任何一個查重系統的數據庫對比范圍都是有限的,所以可能存在雖然論文抄襲了,但是系統沒有找到相似來源的情況好多論文查重系統檢測是不對外開放的,建議同學們可以去查重幫平臺進行查重哦,準確率也是可以保證的。