hypervolume indicator and dominance reward based multi-objective monte-carlo tree search : تی پی بین

hypervolume indicator and dominance reward based multi-objective monte-carlo tree search

hypervolume indicator and dominance reward based multi-objective monte-carlo tree search
نویسندگان :

weijia wang

michèle sebag
کلمات کلیدی :

multi

monte

objective optimization

reinforcement learning

carlo tree search

sequential decision making
جزئیات بیشتر مقاله
- تاریخ ارائه: 1392/07/24
- تاریخ انتشار در تی پی بین: 1392/07/24
- تعداد بازدید: 1057
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
concerned with multi-objective reinforcement learning (morl), this paper presents momcts, an extension of monte-carlo tree search to multi-objective sequential decision making, embedding two decision rules respectively based on the hypervolume indicator and the pareto dominance reward. the momcts approaches are firstly compared with the morl state of the art on two artificial problems, the two-objective deep sea treasure problem and the three-objective resource gathering problem. the scalability of momcts is also examined in the context of the np-hard grid scheduling problem, showing that the momcts performance matches the (non-rl based) state of the art albeit with a higher computational cost.

سوال خود را در مورد این مقاله مطرح نمایید :

سوال شما برای نویسنده مقاله نیز ارسال می گردد.در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.
با انتخاب دکمه “ثبت پرسش”، موافقت خود را با قوانین انتشار محتوا در تی پی بین اعلام می کنم.

در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم

hypervolume indicator and dominance reward based multi-objective monte-carlo tree search

weijia wang

michèle sebag

سوال خود را در مورد این مقاله مطرح نمایید :

استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود

بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها

تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)

جداسازی اکسید روی از لجن واحد آگلومراسیون ذوب آهن اصفهان به روش هیدرومتالوژی

یک مدل شبکه دو لایه یکپارچه برای طراحی زنجیره تامین مقاوم برای اقلام فاسد شدنی تحت اختلال

بررسی آلودگی کفش های محیط های استریل و نیمه استریل اتاق عمل بیمارستان توحید سنندج

بررسی وضعیت سلامت اجتماعی در دانشجویان تربیت بدنی دانشگاه آزاد اسلامی واحد بیرجند

head-on collision of ion-acoustic solitons in an ultracold neutral plasma

مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول

مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران

واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی

بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)

بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)

بررسی خواص فیزیکی و شیمیایی و خواص زیست تخریب پذیری و ضد میکروبی کامپوزیت پلیمرهای زیست تخریب پذیر

تاثیر بازاریابی کارآفرینانه بر عملکرد صادراتی با نقش میانجی دوره های آموزش ضمن خدمت ( مورد مطالعه :شرکت لبنیات پاستوریزه پاک )

تحلیل حقوقی نظام حقوق بین الملل در راستای مقابله با خشونت علیه زنان

عفو و توبه به عنوان آسیب های وارد بر قطعیت اجرای کیفر در نظام حقوقی ایران

adsorption of so2 and no2 on zro2 (1 1 0) surface: density functional theory and molecular dynamic simulation studies