人類的行為總是在盤算,找到最佳的決策後就開始行動,但是每當遇到困難挫折時,就會修正自己的決策,並且之後再遇到類似的狀況時就會記取教訓,避免重蹈覆轍,就這樣從零開始學起直到擁有豐富的經驗後可順利的達到目標。
強化學習(Reinforcement Learning)的技術不但涵蓋以上人類的決策要素,並且也實現了人類學習的摸索過程;其中包括最佳策略(Policy)的衡量、利弊得失(Reward)的分析、記取教訓、累積經驗、沙盤推演等行為要素。因此強化學習的技術可以讓我們所設計的產品更具有人工智慧的特質。近年來,強化學習結合使用深度學習(Deep Learning)來加強最佳決策的推演,使得深度強化學習(Deep Reinforcement Learning)成為目前開發人工智慧產品不可或缺的關鍵技術。
本課程細說強化學習求解最佳策略(Policy)及酬勞(Reward)的方法,結合深度學習技術,以AlphaGo設計理念、問答學習系統、汽車避撞系統、自駕車強化學習、Game Player等實例說明其原理及應用方法,使學員能夠快速上手深度強化學習的應用。
※上課時間 :歡迎機關團體或個人隨時來電洽詢。
※基礎 :具備有 Python 程式語言及 TensorFlow 的設計基礎者均可參加此課程。
Designed by ezb2b2c