

已閱讀1頁,還剩74頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、在金融管理、空中交通管制、通信網(wǎng)絡管理等領域存在很多復雜問題,單個Agent解決不了,因為資源或者能力有限,而多Agent系統(tǒng)提供了解決這些問題的可能。但隨著科學技術的發(fā)展,軟件結構向大型復雜轉變并呈現(xiàn)出分布式特征,軟件的運行環(huán)境也從靜態(tài)封閉走向動態(tài)開放,這些新的變化對軟件提出了更高的要求,要求軟件必須具備自適應的能力,即當環(huán)境發(fā)生變化時,系統(tǒng)通過調(diào)整自身的結構或行為策略仍能正常運行。學習作為自適應的重要技術也備受關注,但常規(guī)的學習方法
2、由于需要人直接參與或者間接參與(包括預先指定動作策略或效用策略),要求系統(tǒng)設計者在設計階段描述所有的系統(tǒng)行為和環(huán)境狀態(tài),對系統(tǒng)設計者要求太高而且往往難以實現(xiàn)。強化學習非常適用于沒有太多環(huán)境信息的問題域,因為在該方法中詳細的環(huán)境模型不是必須的,因此如何將強化學習應用到軟件自適應演化中,是當前研究的熱點與難點。
本文主要研究將強化學習方法應用到軟件自適應演化中。首先給出一種基于Agent的軟件自適應演化支撐框架,并詳細闡述了該框架
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向決策仿真的Agent模型中強化學習方法的研究.pdf
- 工程應用中強化學習方法研究.pdf
- 分層強化學習方法研究.pdf
- 茶學領域本體自適應學習方法研究.pdf
- 自適應代價敏感決策樹的學習方法.pdf
- 基于時間集成與自適應諧振的深度學習方法研究.pdf
- 軟件自適應演化中動態(tài)環(huán)境感知機制的研究.pdf
- 基于自適應的LVCSR系統(tǒng)半監(jiān)督學習方法的研究.pdf
- 多智能體強化學習方法研究.pdf
- 強化學習方法及其應用研究.pdf
- 基于因素化表示的強化學習方法研究.pdf
- 面向強化學習的規(guī)劃優(yōu)化方法研究.pdf
- 連續(xù)狀態(tài)—動作空間下強化學習方法的研究.pdf
- 基于Option自動生成的分層強化學習方法研究.pdf
- 基于模糊近似的強化學習方法研究.pdf
- 基于稀疏梯度域自適應字典學習方法的CT重建.pdf
- 連續(xù)狀態(tài)—動作空間下強化學習方法的研究
- 模型無關的貝葉斯強化學習方法研究.pdf
- 基于模糊聚類的分層強化學習方法研究.pdf
- 面向概念漂移問題的選擇性適應集成學習方法研究.pdf
評論
0/150
提交評論