یادگیری تقویتی و برنامهسازی پویا با استفاده از تخمین گرههای تابع
سیستمهای کنترل رقمی / برنامهنویسی پویا
سامانههای کنترل تأثیر بسیار زیادی بر جامعه ایجاد میکنند. آنها برای کار همه وسایل، از وسایل اولیه خانگی تا تأسیسات انرژی هستهای و هواپیماها ضروری هستند. ویژگی مشترک کاربردهای متفاوت کنترل نیاز به تأثیرگذاری یا تغییر رفتار سیستمهای پویا برای دستیابی به اهداف از پیش تعیین شده است. یک روش برای رسیدن به آن اختصاص شاخص عملکرد عددی به هر مسیر وضعیت سیستم است. سپس مسئله کنترل با جستجو برای سیاست کنترل حل میشود، که سیستم را در جهت مسیرهای متناظر با بهترین مقدار شاخص عملکرد راهاندازی میکند. کتاب حاضر عملکرد کاملی از یادگیری تقریبی قابل دسترسی و روشهای برنامه نوسازی پویا را با استفاده از تقریب زنندههای تابع فراهم کرده است.