下面CNCNKI查重網(wǎng)就為畢業(yè)生們歸納下知網(wǎng)最新查重規(guī)則及原理如下,這個原理適用于市面所有檢測系統(tǒng)的: 1、知網(wǎng)查重是連續(xù)13字符相似就會判為重復(fù),13字符就相當(dāng)于6-7個中文漢字。
封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會各自分成一個片段來檢測,每一個片段都計算出一個相似度,再通過這樣每章的相似度來計算出整篇論文的總重復(fù)率。 當(dāng)知網(wǎng)查重系統(tǒng)識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標(biāo)準(zhǔn)就變得更嚴(yán)格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 在知網(wǎng)查重進行中,檢測系統(tǒng)只能識別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測的,因為檢測系統(tǒng)尚無法識別這些復(fù)雜的內(nèi)容格式。
大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對的方式進行重復(fù)率檢測。 而不是簡單地基于某個最小語句為單位(比如傳說中的“13個字連續(xù)一樣”),進行“循環(huán)比對”這么簡單。
根據(jù)知網(wǎng)的最新查重規(guī)則原理我們可以看出參考同屆的畢業(yè)論文知網(wǎng)檢測系統(tǒng)是查重不到的,只要不被老師發(fā)現(xiàn)那就可以,另外本科生可以參考學(xué)長的內(nèi)部論文,研究生可以參考本科學(xué)長內(nèi)部論文。 (PS:內(nèi)部論文就是未公開的保密論文在知網(wǎng)數(shù)據(jù)庫中查詢不到)。