• بررسی تاثیر پیش پردازش بر روی کیفیت داده و مدل های پیش بینی عود مجدد سرطان پستان

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1396/11/30
    • تاریخ انتشار در تی پی بین: 1396/11/30
    • تعداد بازدید: 1026
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -

    امروزه به دلیل شیوع انواع سرطان ها، محققان زیادی علاقه مند به کشف دانش مفید موجود در داده های سرطانی شده اند. داده کاوی یکی از ابزارهای قدرتمندی است که بدین منظور استفاده می شود اما نتایج آن زمانی قابل اعتماد و مفید است که داده های با کیفیتی در اختیار باشد. با توجه به اینکه اکثر داده های دنیای واقعی دارای نواقصی هم چون ناسازگاری، خطا، نویز، مقادیر گمشده و ... می باشند، پیش پردازش داده ها امری جداناپذیر از داده کاوی است. در این مقاله بر روی یک مجموعه داده واقعی سرطان پستان کار شده که هدف بررسی تاثیر پیش پردازش برروی کیفیت داده و نتایج مدل های پیش بینی عود سرطان پستان می باشد. در ابتدا با استفاده از سه الگوریتم طبقه بندی نزدیک ترین همسایه، بیز ساده و بهینه سازی حداقل ترتیبی، مدل های پیش بینی ساخته شده اند. سپس پیش پردازش هایی از قبیل رفع خطا و ناسازگاری، پرکردن مقادیر بدون محتوی و کاهش داده (انتخاب ویژگی) بر روی مجموعه داده اعمال و مجددا مدل های پیش بینی ساخته شده اند. در پایان نتایج مدل های پیش بینی با استفاده از دو معیار صحت و حساسیت با یکدیگر مقایسه گردیده اند. نتایج ارزیابی نشان می دهد که مدل های پیش بینی بهینه سازی حداقل ترتیبی از نظر صحت و حساسیت به ترتیب 3.56 و 73.59، بیز ساده 4.86 و 66.16 و نزدیک ترین همسایه 5.4 و 60.9 درصد نسبت به قبل از پیش پردازش داده ها رشد داشته است. بنابراین پیش پردازش موجب بهبود نتایج طبقه بندی و کیفیت داده می شود.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها