荷蘭出版巨頭Elsevier的研究誠(chéng)信負(fù)責(zé)人IJsbrand Jan Aalbersberg說(shuō),“為了發(fā)現(xiàn)所有文獻(xiàn)中重復(fù)的圖片,出版商需要?jiǎng)?chuàng)建一個(gè)共享的數(shù)據(jù)庫(kù),用于比較已發(fā)表和待發(fā)表的圖片。 ”[4] 盡管仍然存在各種現(xiàn)實(shí)問(wèn)題,不過(guò)大趨勢(shì)已經(jīng)非常明顯。
每到大學(xué)畢業(yè)的季節(jié),學(xué)術(shù)查重是必不可少的話題,因?yàn)檎撐牟橹貦z測(cè)不通過(guò)就不能順利的去答辯畢業(yè)。 對(duì)于每個(gè)正處于寫(xiě)畢業(yè)論文的學(xué)生來(lái)說(shuō)學(xué)術(shù)查重都不陌生,在面對(duì)高校學(xué)術(shù)查重的時(shí)候都會(huì)遇到很多關(guān)于學(xué)術(shù)論文查重的問(wèn)題,其中引用格式識(shí)別是最關(guān)注的問(wèn)題。
目前國(guó)內(nèi)所有的查重系統(tǒng)里,其中還包含了學(xué)術(shù)查重系統(tǒng),在檢測(cè)是無(wú)法對(duì)圖片進(jìn)行識(shí)別的,是會(huì)直接跳過(guò)圖片的;若是一定要對(duì)圖片進(jìn)行識(shí)別的話,那就只能通過(guò)人工肉眼查看。 學(xué)術(shù)查重的原理是在查重時(shí)把論文轉(zhuǎn)化成文本,之后再進(jìn)學(xué)術(shù)對(duì)比連續(xù)13個(gè)以上相似的字?jǐn)?shù)就會(huì)被視為抄襲;主要是文字內(nèi)容的比較,全部的論文內(nèi)容都是轉(zhuǎn)換文字內(nèi)容進(jìn)行比較;現(xiàn)在還沒(méi)有很完美的OCR軟件可以把圖片轉(zhuǎn)化成文字來(lái)進(jìn)行比較;但圖片嗎的下方文字注釋說(shuō)明會(huì)被檢測(cè)到的,那是因?yàn)閳D片的注釋本事就是文字。
同學(xué)們首先要知道的是,圖片是由圖形、圖像等構(gòu)成的平面媒體;圖片的格式有很多,但整體上是可以分為點(diǎn)陣圖和矢量圖兩種類(lèi)型;大家普遍用的是BMP、JPG、等格式都是點(diǎn)陣圖形,然而SWF、CDR、AI等是屬于矢量圖形。 隨著數(shù)字采集技術(shù)和信號(hào)處理技術(shù)的發(fā)展,越來(lái)越多的圖片以數(shù)字形式存儲(chǔ);圖片在論文里有很大的作用。 目前國(guó)內(nèi)所有的查重系統(tǒng)里,其中還包含了學(xué)術(shù)查重系統(tǒng),在檢測(cè)是無(wú)法對(duì)圖片進(jìn)行識(shí)別的,是會(huì)直接跳過(guò)圖片的;若是一定要對(duì)圖片進(jìn)行識(shí)別的話,那就只能通過(guò)人工肉眼查看。