یادگیری تقویتی یک نوع یادگیری ماشینی است که به ماشین ها و عوامل نرم افزاری اجازه می دهد هوشمندانه و به طور خودکار رفتار مطلوب را در یک محیط خاص شناسایی کند تا بتواند عملکرد و بهره وری آن را به حداکثر برساند. در این دوره با معرفی یادگیری تقویتی، محاسبات نتایج احتمالا موفق با استفاده از بسته محبوب MDPToolbox، برنامه نویسی محیط برای یادگیری تقویتی و غیره آشنا می شوید.
سرفصل:
- یادگیری تقویتی می تواند چه کارهایی برای شما انجام دهد
- معرفی دوره
- درک مشکل “Grid World” در یادگیری تقویتی
- پیاده سازی Grid World Framework در R
- ناوبری Grid World و محاسبه نتایج موفقیت آمیز
- اولین برنامه یادگیری تقویتی شما
- مثال R – پیدا کردن سیاست مناسب ناوبری
- برنامه نویسی محیط
- R Example – MDPtoolbox Solution Navigating 2 x 2 Grid
- مثال های MDPtoolbox با R
- R Example – Finding Optimal 3 x 4 Grid World Policy
- R Exercise – Building a 3 x 4 Grid World Environment
- R Exercise Solution – Building a 3 x 4 Grid World Environment
لينک منبع