یادگیری تقویتی در سیستم های چندعامله غیرهمکار : تی پی بین

یادگیری تقویتی در سیستم های چندعامله غیرهمکار

یادگیری تقویتی در سیستم های چندعامله غیرهمکار
نویسندگان :

عاطفه بابائی
کلمات کلیدی :

learning

تئوری بازی ها

یادگیری تقویتی

سیستم های چندعامله

nash q

بازی های تصادفی
جزئیات بیشتر مقاله
- تاریخ ارائه: 1393/09/05
- تاریخ انتشار در تی پی بین: 1393/09/05
- تعداد بازدید: 1662
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
یکی از مسائلی که در زمینه تحقیقات سیستم های چندعامله مورد توجه قرار گرفته است، استفاده از تکنیک های یادگیر و تجهیز سیستم های چندعامله با توانایی های یادگیری می باشد. در این مسائل چندین تعادل نش وجود دارد. در یادگیری تقویتی سیستم های چندعامله، بیشترین تضمین همگرایی الگوریتم های یادگیری به تعادل نش بهینه است. بازی های تصادفی بعنوان توسعه ای از فرایندهای تصادفی مارکوف با چندعامل در سیستم های چندعامله و مدل سازی آنها دارای اهمیت بوده و بعنوان چارچوبی مناسب در تحقیقات یادگیری تقویتی چندعامله بکار رفته اند. در این مقاله الگوریتم یادگیری تقویتی nash-q برای حل نوعی از بازی تصادفی grid-world که سیستم چندعامله غیرهمکار است و دارای دو تعادل نش است، بکار برده شد و نتایج نشان داده شدند.

سوال خود را در مورد این مقاله مطرح نمایید :

سوال شما برای نویسنده مقاله نیز ارسال می گردد.در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.
با انتخاب دکمه “ثبت پرسش”، موافقت خود را با قوانین انتشار محتوا در تی پی بین اعلام می کنم.

در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم

یادگیری تقویتی در سیستم های چندعامله غیرهمکار

عاطفه بابائی

سوال خود را در مورد این مقاله مطرح نمایید :

استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود

بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها

تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)

تاثیر مدارس طبیعت در نهادینگی فرهنگ زیست گرایی جامع بشری

مقایسه عوامل مؤثر بر عدم گرایش به نگارش مقالات علمی از دیدگاه اعضای هیأت علمی علوم پایه و بالینی دانشگاه علوم پزشکی همدان

بررسی قابلیت لحیم کاری سخت هاردمتال تنگستن کاربید کبالت به فولاد ابزار

towards a steady forming condition for radial–axial ring rolling

contraction behaviors of dental composite restorations — finite element investigation with dic validation

مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول

مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران

واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی

بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)

بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)

رابطه اشتیاق شغلی و رشد حرفه ای معلمان بر بالندگی سازمانی در معلمان مقطع اول متوسطه شهرستان خنجین

تاثیر تمرکز بازار حسابرسی، تخصص حسابرس در صنعت و تجربه کمیته حسابرسی بر قیمت گذاری حسابرسی

مدل سازی خرید مد آنلاین: ارزیابی مبتنی بر خرید حر فه ای مد آنلاین

راهکارهایی جهت پرورش ادراک موسیقایی دانش آموزان پایه ابتدایی (مطالعه موردی: بازی و سرگرمی)

بررسی نقـش شاخص های بازاریابی در توسعه صنعت گردشگری ورزشی