improving monte carlo tree search by combining rave and quality-based rewards algorithms : تی پی بین

improving monte carlo tree search by combining rave and quality-based rewards algorithms

improving monte carlo tree search by combining rave and quality-based rewards algorithms
نویسندگان :

masoud masoumi moghadam

mohammad pourmahmood aghababa

jamshid bagherzadeh
کلمات کلیدی :

monte

reinforcement learning

carlo tree search

game of hex

heuristics
جزئیات بیشتر مقاله
- تاریخ ارائه: 1396/11/30
- تاریخ انتشار در تی پی بین: 1396/11/30
- تعداد بازدید: 354
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
monte-carlo tree search is a state-of-the-art method for building intelligent agents in games and has been focus of many researchs through past decade. by using this method, the agents are able to master the games through building a search tree based on samples gathered by randomized simulations. in most of the researchs, the reward from simulations are discrete values representing final state of the games (win, loss, draw), e.g., rє {-1, 0, 1}. in this paper, we introduce a method which modifies reward for each playout. then it backpropagates the reward through uct and amaf values. rave algorithm is used to evaluate the nodes more accurately in each tree breadth. we implemented the algorithm along with last-good-reply, decisive-move and poolrave heuristics. in the end we used leaf parallelization in order to increase the samples gathered by simulations. all implementations are examined in the game of hex in 9 × 9 board. we show the proposed method can improve the performance in the domain discussed.

سوال خود را در مورد این مقاله مطرح نمایید :

سوال شما برای نویسنده مقاله نیز ارسال می گردد.در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.
با انتخاب دکمه “ثبت پرسش”، موافقت خود را با قوانین انتشار محتوا در تی پی بین اعلام می کنم.

در صورت درج پاسخ از طریق ایمیل به شما اطلاع داده خواهد شد.

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم

improving monte carlo tree search by combining rave and quality-based rewards algorithms

masoud masoumi moghadam

mohammad pourmahmood aghababa

jamshid bagherzadeh

سوال خود را در مورد این مقاله مطرح نمایید :

استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود

بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها

تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)

بررسی آزمایشگاهی رفتار گسیختگی خاکهای سیمانی شده مصنوعی

همبستگی عزت نفس و پیشرفت تحصیلی در دانشجویان توانبخشی دانشگاه علوم بهزیستی و توان بخشی تهران

بررسی اپیدمیولوژیک آپاندیسیت خوشه ای در استان چهارمحال و بختیاری

تأثیر خوراکی عصاره گزنه بر بیان عامل رشد دگرگون کننده-بتا (tgf-β) در میزبان های واجد تومور

بررسی رفتار پی های رادیه- ریزشمع در خاک رس کرمان (مطالعه موردی: برج جمهوری)

مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول

مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران

واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی

بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)

بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)

بررسی رابطه باورهای فراشناختی با سلامت دانش آموزان دختر مقطع متوسطه

رابطه جدایی مالکیت از کنترل با محافظه کاری غیرشرطی حسابداری شرکت ها

تاثیر حاکمیت شرکتی بر ثبات مالی و دسترسی به خدمات مالی در بانک های پذیرفته شده در بورس اوراق بهادار تهران

بررسی رابطه بین ساختار مالکیت، ترکیب اعضای هیئت مدیره و سرعت گزارشگری مالی در شرکت های پذیرفته شده در بورس اوراق بهادار تهران

بررسی عملکرد انتشار اوراق مشارکت شهرداری مشهد بر اساس مدل swot -ahp