• جزئیات بیشتر مقاله
    • تاریخ ارائه: 1393/09/05
    • تاریخ انتشار در تی پی بین: 1393/09/05
    • تعداد بازدید: 759
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    الگوریتم های تکاملی برای حل مسائل بهینه سازی سراسری و مسائل بهینه سازی پویا، استفاده می شود. یکی از الگوریتم های تکاملیpso  می باشد که عیب آن این است که برای حل مسائل پیچیده چند وجهی به راحتی در بهینه محلی می افتد. برای حل مسئله سراغ یادگیری تقویتی رفتیم. یکی از ویژگی های مهم روش های یادگیری تقویتی این است که بر خلاف بیشتر روش های یادگیری در این روش به عامل یاد گیرنده گفته نمی شود که در هر موقعیتی کنش بهینه کدام کنش بوده است. در عوض این وظیفه عامل است که با تجربه کردن کنش های مختلف تشخیص دهد که کدامیک منجر به پاداش بیشتری می شوند و کنش بهتری هستند. در روش پیشنهادی جهت بهبودpso  ابتدا آن را آشوبی کرده و سپس از الگوریتمq-learning  استفاده شده است. از آشوب جهت بهبود در سرعت همگرایی الگوریتم استفاده شده است. نتایج با الگوریتمpso  معمولی و الگوریتمpso  آشوبی(pso)  مقایسه شده است که نشان دهنده برتری الگوریتم پیشنهادی می باشد. جهت ارزیابی از تعدادی تابع محک استفاده شده است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم