• بهبود یادگیری الگوریتم بهینه سازی ازدحام با رویکرد یادگیری تقویتی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1393/09/05
    • تاریخ انتشار در تی پی بین: 1393/09/05
    • تعداد بازدید: 3141
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    یکی از الگوریتم های مشهور هوش جمعی، الگوریتمpso  است که ابزار مناسب برای حل مسائل بهینه سازی سراسری می باشد. در بسیاری از الگوریتم های بهینه سازی ازدحام ذرات، ذرات از الگوی یادگیری واحد استفاده می کنند؛ که باعث می شود ذره در موقعیت های مختلف پیچیده موفق عمل نکند. به منظور حل این مسائل، ذرات نیاز به یادگیری استراتژی های مختلف برای مقابله با موقعیت های مختلف؛ دارند. جهت بهبود این مسئله سراغ یادگیری تقویتی رفتیم که یکی از روش های یادگیری است که می تواند ایده ای نو برای هوشمندی بیشتر در عامل ها باشد. در روش پیشنهادی ازq-learning  برای افزایش توانایی در جستجو و جلوگیری از افتادن در بهینه محلی استفاده می شود. برای ارزیابی نتایج از 5 تابع محکde jong function n. 5, sum squares, zakharov, sphere, ackley  استفاده شده است. نتایج با الگوریتمpso  معمولی و الگوریتمpso  آشوبی(cpso)  مقایسه شده است. از مشاهده نتایج دیده می شود که نرخ همگرایی بهتر از بقیه روش ها شده است و همچنین بهینه ی سراسری واقعی تر نسبت به دیگر الگوریتم ها بدست آمده است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها