• جزئیات بیشتر مقاله
    • تاریخ ارائه: 1392/07/24
    • تاریخ انتشار در تی پی بین: 1392/07/24
    • تعداد بازدید: 1425
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    روش برنامه ریزی پویای استوکاستیک صریح (stochastic dynamic programming) sdp برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققان همواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یک سیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش sdp مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها