面向媒體應用的高能效神經網絡可重構陣列結構與系統(tǒng)調度.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,隨著互聯(lián)網和信息技術的發(fā)展,人工神經網絡逐漸成為信息技術領域的研究熱點,在圖像識別、語音翻譯和視頻檢測等媒體領域有著廣泛的應用。人工神經網絡算法種類繁多,可以通過不同的權重系數(shù)實現(xiàn)不同的功能。粗粒度可重構架構可以通過配置實現(xiàn)不同的算法功能,兼?zhèn)淞烁哽`活性和高能效性。本文結合可重構架構和神經網絡算法的共性特征,對面向媒體處理的可重構神經網絡系統(tǒng)進行了研究。
  本文從媒體算法和神經網絡算法的特征入手,選取多層感知器(Mult

2、i-Layer Perceptron,MLP)處理圖像和視頻編碼中運算量大的部分算法。本文分析了面向媒體處理的可重構神經網絡系統(tǒng)結構中的權重、配置和計算數(shù)據的數(shù)據流特征,為系統(tǒng)優(yōu)化奠定基礎。在可重構神經網絡陣列方面,本文通過AxBench近似計算平臺,得出了相對較優(yōu)的陣列規(guī)模。針對MLP網絡的數(shù)據流特征,設計了一種基于計算負載動態(tài)自適應的路由結構,降低了陣列路由的復雜度,提高了陣列的計算性能和PE利用率。通過配置壓縮和權重分組的方法減少

3、了片上存儲的硬件開銷。在系統(tǒng)調度方面,本文一方面結合媒體數(shù)據采樣關系,設計了針對權重、配置的調度策略和調度模塊,對權重和配置進行預加載,填充了流水氣泡,提高了系統(tǒng)的計算性能。另一方面,結合視頻編碼多個模塊間的數(shù)據調度特征和運動矢量可預測特征,本文設計了基于動態(tài)預取機制的多模式數(shù)據調度策略及調度模塊,既解決了多個模塊間的數(shù)據交互問題又以較少的存儲開銷實現(xiàn)了較高的預取命中率,提升了訪存性能。
  本文設計的基于計算負載自適應的路由結構

4、相比單一的Mesh路由結構計算性能提升了30.1%,PE利用率提升了16.7%。此外,在配置壓縮和權重分組的基礎上,配置和權重的調度模塊又將系統(tǒng)性能提升10.0%。基于高能效動態(tài)預取機制的數(shù)據緩存模塊在僅用12KB存儲開銷的情況下取得了90%以上的預取命中率,訪存性能提升了39%~45%。本文采用SMIC40nm的工藝對基于可重構神經網絡媒體處理系統(tǒng)進行了綜合驗證。實驗結果表明,圖像模式可以實現(xiàn)17fps~87fps@480P的編碼操作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論