• بهینه سازی تخصیص بار آلودگی در رودخانه با استفاده از روش های یادگیری تقویتی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1392/07/24
    • تاریخ انتشار در تی پی بین: 1392/07/24
    • تعداد بازدید: 1618
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    استفاده از برنامه ریزی پویای استوکستیک (sdp)در مدلهای بهینه سازی بزرگ مقیاس منابع آب به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم و در نتیجه بروز مشکل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (rl) یکی از تکنیکهای پیشرفته مبتنی بر شبیه سازی در حل مسائل تصمیم گیری متوالی در محیط استوکستیگ است. در این مقاله مساله بهینه سازی تخصیص بار آلاینده در رودخانه با استفاده از rl حل شده و کارایی روش با مدل sdp مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش rl در نیل به جواب بهینه مساله تحت بررسی و سرعت بالاتر آن در مقایسه با روش sdp است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها