

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、學(xué)校代碼:10135論文分類號:學(xué)號:20084019005研究生類別:全日制幽喜之卸貉犬謦碩士學(xué)位論文基于后綴語法樹的代碼抄襲檢測研究CodePlagiarismDetectionResearchBasedonSuffiXTree學(xué)科門類:一級學(xué)科:學(xué)科、專業(yè):研究方向:申請人姓名:指導(dǎo)教師姓名:工學(xué)計算機科學(xué)與技術(shù)計算機應(yīng)用技術(shù)多媒體與gAI李彥臣劉東升2010年3月30日,Lr|7,r中文摘要隨著信息技術(shù)的不斷發(fā)展,抄襲正變得越來
2、越容易和難以防范。在程序設(shè)計類課程作業(yè)和在線測試的考評中,學(xué)生相互抄襲的現(xiàn)象也普遍存在。澳大利亞蒙納什(Monash)大學(xué)對其學(xué)生中的代碼抄襲現(xiàn)象進行調(diào)查統(tǒng)計顯示:高達854%的學(xué)生承認抄襲過他人的作業(yè)。日益嚴重的抄襲現(xiàn)象已經(jīng)嚴重地破壞了正常的教學(xué)秩序,也影響了教學(xué)質(zhì)量和學(xué)生素質(zhì)的提高。為了扼制不良學(xué)風,對高效率的代碼抄襲檢測方法進行研究顯得日趨必要。本文在分析目前國內(nèi)外程序代碼抄襲檢測研究的基礎(chǔ)上,針對學(xué)生C語言程序代碼作業(yè)中常見的抄
3、襲方法,提出一種基于后綴樹的程序代碼抄襲檢測方法。首先制定基于ANTLR的C語言文法文件,利用ANTLR生成C語言的詞法及語法分析器,’并對程序代碼進行詞法和語法分析,生成C程序代碼的后綴語法樹。其次對生成的后綴語法樹進行遍歷和優(yōu)化,去除語法樹中的冗余信息,得到一個字符串序列,該字符串序列標準化地表示了程序代碼中的信息。第三,采用改進后的貪婪字符串匹配算法,對后綴樹字符串序列進行了匹配計算,通過一個確定了決策函數(shù)計算出兩個字符串序列的相
4、似值,并以此為依據(jù)來度量兩個程序代碼之間相似程度。最后根據(jù)給定的閾值來判斷兩個程序之間是否存在抄襲嫌疑?;谏鲜龇椒?,設(shè)計并實現(xiàn)了一個C語言程序代碼抄襲檢測實驗系統(tǒng),該實驗系統(tǒng)可以檢測程序集合中任意兩個程序代碼之間的相似度。選用了不同的方法對實驗系統(tǒng)的有效性和可靠性進行測評。實驗結(jié)果表明,該方法能夠檢測出C語言代碼中存在的多種抄襲手段,并有較高的檢測效率。與國外成熟的的檢測系統(tǒng)MOSS對比,該實驗系統(tǒng)在檢測精度和準確性方面都有較高的優(yōu)越
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于抽象語法樹的程序代碼抄襲檢測技術(shù)研究.pdf
- 基于抽象語法樹的重復(fù)代碼檢測.pdf
- 基于后綴數(shù)組的克隆代碼檢測研究.pdf
- 基于AST的多語言代碼抄襲檢測研究.pdf
- 程序代碼抄襲檢測的研究.pdf
- 基于N-gram的程序代碼抄襲檢測方法研究.pdf
- 基于SVM的抄襲檢測研究.pdf
- 基于后綴樹的帶有通配符的模式匹配研究.pdf
- 基于XML文檔相似度與聚類相結(jié)合的代碼抄襲檢測研究.pdf
- 基于抽象語法樹和靜態(tài)分析的克隆代碼自動重構(gòu).pdf
- 基于UML的C語言程序代碼防抄襲檢測系統(tǒng)的研究與實現(xiàn).pdf
- 程序代碼抄襲檢測中串匹配算法的研究與實現(xiàn).pdf
- Web應(yīng)用中基于樹的克隆代碼檢測方法的研究.pdf
- 基于后綴樹與后綴數(shù)組混合結(jié)構(gòu)的基因序列比對算法研究.pdf
- 基于小波樹的后綴數(shù)組壓縮算法.pdf
- 基于后綴樹模型的流文本表示研究及其應(yīng)用.pdf
- 一種基于后綴樹的時態(tài)XML索引研究.pdf
- 基于后綴樹的P2P搜索技術(shù)研究.pdf
- 基于后綴樹的中文文本聚類算法研究.pdf
- 基于抽象語法樹和改進粒子群算法的代碼同源性分析.pdf
評論
0/150
提交評論