• یادگیری تقویتی در سیستم های چندعامله غیرهمکار

    نویسندگان :
    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1393/09/05
    • تاریخ انتشار در تی پی بین: 1393/09/05
    • تعداد بازدید: 1662
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    یکی از مسائلی که در زمینه تحقیقات سیستم های چندعامله مورد توجه قرار گرفته است، استفاده از تکنیک های یادگیر و تجهیز سیستم های چندعامله با توانایی های یادگیری می باشد. در این مسائل چندین تعادل نش وجود دارد. در یادگیری تقویتی سیستم های چندعامله، بیشترین تضمین همگرایی الگوریتم های یادگیری به تعادل نش بهینه است. بازی های تصادفی بعنوان توسعه ای از فرایندهای تصادفی مارکوف با چندعامل در سیستم های چندعامله و مدل سازی آنها دارای اهمیت بوده و بعنوان چارچوبی مناسب در تحقیقات یادگیری تقویتی چندعامله بکار رفته اند. در این مقاله الگوریتم یادگیری تقویتی nash-q برای حل نوعی از بازی تصادفی grid-world که سیستم چندعامله غیرهمکار است و دارای دو تعادل نش است، بکار برده شد و نتایج نشان داده شدند.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها