

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、ResearchOnOptimizationofSQLtoMapreduce●。一_1ranslatorAThesisSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBYMaXnSupervisedbyAssociateProfessorSongAiboSchoolofComputerScience&EngineeringSoutheastUn
2、iversityNanjingCHINAJune2014摘要摘要隨著電子商務、社交網絡以及物聯網等新一代大規(guī)?;ヂ摼W應用的快速發(fā)展,企業(yè)需要存儲與處理的數據規(guī)模己發(fā)展到TB級甚至PB級。云計算數據處理系統(tǒng)Hadoop采用了數據并行計算的思想處理大數據,其提供的編程模型MapReduce近年來被廣泛用于企業(yè)信息處理、科學實驗統(tǒng)計、生物計算等領域。使用MapReduce進行復雜數據分析處理時,查詢請求都是通過翻譯工具翻譯成MapReduce
3、作業(yè)流進行處理,然而目前通過翻譯工具生成的MapReduce作業(yè)流存在作業(yè)數量過多,作業(yè)代碼冗長等問題,導致查詢執(zhí)行效率低下,已經不能很好的適應人們的需求。本文針對MapReduce上層的高級查詢工具存在的問題,對類SQL查詢到MapReduce作業(yè)流的翻譯優(yōu)化技術進行了研究。本文分析了當前MapReduce上層的高級查詢工具對查詢語句的翻譯優(yōu)化過程,結合Hadoop在掃描數據時采用暴力掃描,并且將計算結果保存到本地磁盤及HDFS的特性
4、,確定了作業(yè)之間最基礎的輸入數據相關性和前驅相關性,根據作業(yè)相關性,設計了作業(yè)之間的合并規(guī)則,解決了作業(yè)流優(yōu)化中如何判斷作業(yè)是否可以合并以及如何合并的問題,為作業(yè)流優(yōu)化提供支撐。針對作業(yè)流包含作業(yè)數量過多、無法快速找出最優(yōu)合并方案的問題,提出了自底向上和自頂向下兩種合并策略,實現作業(yè)流中作業(yè)的快速合并。同時本文分析了MapReduce作業(yè)的執(zhí)行過程,建立了計算作業(yè)執(zhí)行代價的數學模型,解決了預估作業(yè)流執(zhí)行代價的問題。最后將合并策略與代價模
5、型結合,設計了基于代價的相關性敏感的作業(yè)合并算法,利用該算法可以在作業(yè)合并時,選擇執(zhí)行代價較小的作業(yè)流作為最終的合并結果,從而保證類SQL查詢被翻譯為高效的作業(yè)流。本文設計并開發(fā)了SQLMR系統(tǒng),實現上述功能,并搭建了實驗平臺,通過基準測試集TPCH生成測試數據,將SQLMR系統(tǒng)與Hive和YSmart進行了性能對比。實驗結果表明,SQLMR與Hive、YSmart相比,翻譯得到的作業(yè)流可以有效減少磁盤I/0開銷、網絡傳輸開銷,具有明顯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- SQL到SPARK查詢優(yōu)化機制研究.pdf
- MapReduce數據流優(yōu)化的研究.pdf
- 關系模式下從XML到SQL的查詢轉換及優(yōu)化技術.pdf
- 基于MapReduce的查詢處理與優(yōu)化技術研究.pdf
- Oracle SQL到SQL-Serve SQL的機器翻譯實現.pdf
- sql數據庫查詢優(yōu)化
- MapReduce連接聚集查詢優(yōu)化方法的研究與實現.pdf
- 基于GPU的復雜SQL查詢優(yōu)化方法研究.pdf
- MapReduce作業(yè)調度優(yōu)化技術研究.pdf
- 基于代價的MapReduce工作流優(yōu)化.pdf
- sql查詢
- 基于Web服務的SQL到XQuery查詢轉換系統(tǒng)的研究.pdf
- MapReduce作業(yè)調度算法分析與優(yōu)化研究.pdf
- oracle數據庫sql查詢語句優(yōu)化方法研究
- sql模糊查詢
- MapReduce故障容錯研究與作業(yè)調度器優(yōu)化.pdf
- 云環(huán)境下基于MapReduce的查詢優(yōu)化系統(tǒng)研究與實現.pdf
- sql server 查詢優(yōu)化(4)_索引的碎片與管理
- sql查詢語句特例
- sql多表查詢中的分頁
評論
0/150
提交評論