上圖是知網查重系統的檢測范圍,也就是俗稱的查重數據庫,從中可以看到大部分是知網自己收錄的文獻,文章資料,比如碩博論文,學術期刊,會議,報紙,專利,圖書資源等,同時也有互聯網資源庫,互聯網文檔資源,同時還涵蓋了英文數據庫,港澳臺數據庫等,數據庫范圍是非常的廣泛。
知網本身就是數據商,都是自己建設的,通過高校、雜志社等途徑購買。具體數據包括如下:
一般是各大期刊發表的論文,以及碩博士論文
8、所有大學生在寫畢業論文時,必須經歷的一步就是查重目前所有高校對畢業論文查重都有明確要求怎么查論文的重復率paperfree小編給大家講解重復率是判斷學生論文是否符合標準的依據論文重復率測試將直接影響學生能否順利進入。
樓上所言連續30字可能是以前的標準了。。。。我上周用萬方查過,連續5字都查出來了的,至于具體多少字,我不太清楚,但是不會超過12字。。。。而且它會自動去掉標點,像“的”“了”等詞匯,它也很可能過濾出來,將前后連接檢測出重復來。還有段落重復率檢測等等。。。。百度上的很多東西其實網上論文里面可能都存在。。。。我就是百度上找的很多東西,各種亂改,結果跑去萬方,發現有些本來不一樣的都改得跟很多論文一樣了。。。。第一次查出了40%的重復率(當然還沒有加參考文獻尾注,加了尾注的部分應該不算重復率)。。。。后來改了一遍,各種修改詞匯,改語序,改內容順序等等,最后降到了3%以內了。。。。不過據說知網會比萬方高8%左右。。。。
萬方和知網是根據你的論文和他數據庫收錄的論文進行比對的,若有連續30字一樣就認定抄襲,不包括網上百度的。