• جزئیات بیشتر مقاله
    • تاریخ ارائه: 1396/11/30
    • تاریخ انتشار در تی پی بین: 1396/11/30
    • تعداد بازدید: 453
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -

    تعیین شباهت/ فاصله داده ها در بسیاری از الگوریتم های یادگیری ماشین، شناسایی الگو و داده کاوی استفاده می شود. معیار شباهت/فاصله بستگی به داده ها دارد، بنابراین ممکن است یک معیار برای یک کاربرد مناسب ولی برای کاربرد دیگر نامناسب باشد، همین مسئله منجر به پیدایش روش های یادگیری متریک شده است. در بسیاری از مجموعه داده ها که میزان تمایز ویژگی ها در نواحی مختلف داده متفاوت است، استفاده از روش های سراسری یادگیری متریک، کارایی مطلوبی ندارد از این رو روش های محلی ارایه شده اند که چندین نگاشت خطی یا غیرخطی در نواحی مختلف فضای داده یاد می گیرند. از مزایای این روش ها می توان به انعطاف پذیری بالا، یادگیری نگاشت های غیرخطی، مناسب بودن برای مسائل پیچیده مانند داد ههای ناهمگن اشاره کرد. با این وجود بدلیل تعداد زیاد پارامترهای یادگیری، باید برای مشکلات بیش برازش و مقیاس پذیری اندازه مجموعه داده های آموزشی راه کارهای مناسب در نظر گرفته شود. هم چنین مشکل نامتوازن بودن داده های کلاس های مختلف وجود دارد که باید راه کار مناسب برای این مساله ارایه داد. در این مقاله برای حل این مشکلات، روشی برخط یادگیری متریک محلی ارایه شده است، که با یادگیری متریک سراسری و محلی بصورت توام، سعی می کند از مشکل عدم توازن داده ها در نقاط مختلف جلوگیری کند. روش پیشنهادی مبتنی بر pa (passive/aggressive) است و در هر مرحله با دریافت نمونه آموزشی، متریک های محلی لازم و متریک سراسری را بهنگام می کند. برای تعیین فاصله بین دو شی از ترکیب متریک محلی و سراسری استفاده می شود. نتایج آزمایش ها بر روی مجموعه وسیعی از داده های مورد آزمایش تأیید می کند که روش پیشنهادی کارایی نسبت به روش های همتا در مرزهای دانش برتری دارد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها