• یادگیری داده های نامتوازن توسط ترکیبی از الگوریتم های طبقه بندی و خوشه بندی مبتنی بر سیستم فازی قانون محور

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1397/12/20
    • تاریخ انتشار در تی پی بین: 1397/12/20
    • تعداد بازدید: 1122
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -

    مساله مهمی که در استفاده از الگوریتم های طبقه بندی در حوزه های مختلف، صحت مدل هایی را که محققان ارائه می کنند به چالش می کشد، مساله نامتوازن بودن مجموعه داده ها است. مساله نامتوازن بودن داده ها زمانی رخ می دهد که تعداد نمونه های طبقات مختلف متغیر کلاس با هم برابر نبوده و اختلافشان زیاد باشد. در چنین مواقعی نتایج حاصل از الگوریتم های طبقه بندی استاندارد مورد اعتماد نمی باشد. امروزه تحقیقات فراوانی در این زمینه صورت گرفته است. در این مقاله قصد داریم رویکردی جهت جدید یادگیری داده های نامتوازن مبتنی بر سیستم فازی قانون محور ارائه نماییم. در رویکرد پیشنهادی ابتدا توسط تکنیک خوشه بندی داده های نویزی شناسایی شده تا از آن ها در فرآیند یادگیری استفاده نشود. سپس مجموعه داده ها توسط تکنیک دیگری خوشه بندی و داده های هر خوشه متوازن شده و به ازای هر خوشه، مدل یادگیر ساخته می شود. در مرحله دوم وزن هر مدل یادگیر توسط سیستم فازی قانون محور تعیین می گردد. در نهایت برای تجمیع نتایج اگر وزن مدل یادگیر در محدوده قابلیت اطمینان باشد داده های آن خوشه توسط مدل یادگیر همان خوشه طبقه بندی می شوند و گرنه از سیستم رای گیری اکثریت وزن دار مبتنی بر الگوریتم adaboost استفاده می شود. برای انجام ارزیابی، روش پیشنهادی به همراه هفت روش طبقه بندی استاندارد، بر روی هشت دیتاست نامتوازن استاندارد اجرا شده است و شش معیار ارزیابی متداول شامل صحت، حساسیت، وضوح، دقت، f-meaure و g-mean برای ارزیابی این روش ها مورد استفاده قرار گرفته است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها