以可适性接收域法为基础之加强式学习演算法

以可适性接收域法为基础之加强式学习演算法

ID:34139958

大小:363.03 KB

页数:5页

时间:2019-03-03

以可适性接收域法为基础之加强式学习演算法_第1页
以可适性接收域法为基础之加强式学习演算法_第2页
以可适性接收域法为基础之加强式学习演算法_第3页
以可适性接收域法为基础之加强式学习演算法_第4页
以可适性接收域法为基础之加强式学习演算法_第5页
资源描述:

《以可适性接收域法为基础之加强式学习演算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、以可適性接收域法為基礎之加強式學習演算法徐元寶林欣儀黃國勝國立虎尾科技大學資訊工程系國立中正大學電機工程系國立中正大學電機工程系hsuyp@nfu.edu.twAlieta@seed.net.twhwang@ccu.edu.tw摘要生出的架構,可補足BOX的每一次環境狀態的輸本文主要研究一以可適性接收域法,簡稱入僅輸出一個激發點位址的不足,依每一次環境ARM(Adaptable-ReceptionMethod)為基礎之加強狀態輸入而激發一個到多個符合激發條件的位式學習演算法。ARM的主要架構可分為相似度址,且能在每次學習後動態更新神經元的感知域(Similarity)、學習(

2、Learning)、刪除(Pruning)三部位置及大小並使分類邊界成為動態的,更符合份,能在每次學習後,動態更新神經元的感知域大AHC所需的輸入,且提升學習速度。另一個優點小,和調整分類邊界,並且會適當的在神經元個數是激發多個位址時,會適當的對多個有重覆感知超過上限時進行刪減的動作,以節省空間來存放更域的神經元進行刪減的動作,減少不必要的神經多的類別。最後將ARM分類器運算出的分類結果元也可節省空間存放更多的類別。而對於落在未傳送給AHC(AdaptiveHeuristicCritic)架構學習,在感知域中的樣本也會新增一神經元來儲存此新並模擬控制一倒單擺系統,以驗證ARM

3、演算法。的類別,以供之後輸入的樣本的比較歸類指標。關鍵詞:ARM、神經元、刪除、加強式學習但我們發現以FAST配合AHC應用於倒單擺Abstract控制時,需要花很多時間來學習才能夠使倒單擺成AnARM-based(Adaptable-ReceptionMethod)功站立,故本研究將嘗試修改FAST的機制,使倒reinforcementlearningalgorithmisinvestigatedin單擺能更快更容易學習站立。thisarticle.TheARMisaselforganizingarchitecture本文共分為五章,第二章為相關原理介紹,whichcons

4、istsofthreemainstructuresincluding包含分類與加強式學習兩部份,探討與介紹運用similarity,learning,andpruning.Dynamically於此控制器的演算法。第三章描述FAST之修改架adjustingthesizeofsensitivityregionsofeach構。第四章為模擬分析,將模擬結果與其他演算neuronandadaptivelypruningoneoftheneurons法作比較。第五章為討論。whengrownneuronsexceedalimitedvalue,themethodcanpreserv

5、ethesystemresources(availableneurons)toaccommodatemorecategories.The2、適應共振理論(ART)與相關方法clusteredresultbytheARMisthensenttoanAHCART是由Grossberg在1976年所提出的。他(AdaptiveHeuristicCritic)architecture(emulatedby將靜態的競爭式學習神經網路改變成為具動態架apersonalcomputer)tolearntobalanceaninverted構的神經網路,又引進了回授機構(feedbackpe

6、ndulumsystemwhichisalsoemulatedbythemechanism),用以產生由上而下的期望(top-downpersonalcomputerforverifyingtheinvestigatedexpectation),因此神經元在贏得競爭之後還必須algorithm.Accordingtothesimulationresults,the符合這個期望,才有資格進行學習;此時,順向路proposedARMalgorithmisappliedtobalanceaninvertedpendulumdemonstratingbetterperformance

7、徑與回授路徑所產生的交互作用,會使得神經元的thanthatofthegenericFAST-AHCandBOX-AHC.輸出圖樣重複地出現,此即共振狀態(resonantstate),這個理論因而被稱為適應共振理論。1、前言彈性可適尺寸結構(FAST)無監督式學習的網路模式是從問題中取得訓FAST是由Perez&Sanchez在1996年所提練範例,輸入變數值,然後從中學習內部的聚類出。它是一種非監督式學習類神經網路,由ART規則,以應用於新的範例。適應共振理論,簡稱衍生而來,可用來解決動態分類(Dy

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。