-
ارائه رویکرد نیمه نظارتی برای شناسایی داده های پرت در شرایط تغییر توزیع داده
جزئیات بیشتر مقاله- تاریخ ارائه: 1392/07/24
- تاریخ انتشار در تی پی بین: 1392/07/24
- تعداد بازدید: 1342
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
یکی از حوزه های مهم در داده کاوی و یادگیری ماشین، حوزه شناسایی داده پرت می باشد. روش های بسیاری برای شناسایی داده پرت ارائه شده که همه آنها از فرض یکسان بودن توزیع احتمال داده های تست نسبت به داده های آموزش پیروی می کنند. اما در بسیاری از برنامه های کاربردی واقعی نظیر شناسایی اسپم یا تقلب، تفاوت توزیع داده های آموزش و تست یک امر رایج است. این حالت به شرایط تغییرتوزیع مجموعه داده معروف است. مطالعات ما نشان می دهد که هیچ یک از روش های موجود برای شناسایی داده پرت در شرایط تغییر توزیع مجموعه داده عملکرد مناسبی ندارند. مقاله حاضر یک روش نیمه نظارتی سه مرحله ای برای شناسایی داده پرت تحت شرایط تغییر مجموعه داده ارائه می نماید. در مرحله نخست با بکارگیری تکنیک تخمین نسبت چگالی که یک روش وزن دهی بر اساس اهمیت است، وزن نمونه های آموزش تعیین می شود. سپس با استفاده از یک روال نیمه نظارتی ابتکاری نمونه هایی از مجموعه آموزش که نماینگر توزیع واقعی داده های تست هستند، انتخاب می گردند. در مرحله آخر با استفاده از روش اصلاح شده شناسایی داده پرت بر مبنای داده های متعارف، داده های پرت موجود شناسایی می شوند. نتایج آزمایشات نشان می دهند که از نظر تطبیق با شرایط تغییر توزیع مجموعه داده روش پیشنهادی عملکرد بهتری نسبت به روش های موجود دارد.
مقالات جدیدترین رویدادها
-
استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود
-
بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها
-
تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)
-
زیبایی شناسی و تاثیر آن بر فناوری نوین ساخت در معماری پایدار
-
اثر غلظت جیره و افزودن آنتی اکسیدان ها بر هورمون های تیروئیدی جوجه های گوشتی تحت تنش سرمایی
-
بررسی اثرات انسولین و اسیداسکوربیک بر بیان ژن های خانواده ی bcl-2 در ناحیه ی هیپوکامپ موش های صحرایی دیابتی شده توسط استرپتوزوسین
-
an analysis on the situation of poverty in mahabad city by emphasis on the economic dimension
-
optimal dg placement based on dg cost, voltage stability, loses active and ractive and variations load
مقالات جدیدترین ژورنال ها
-
مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول
-
مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران
-
واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی
-
بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)
-
بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)
-
اثر سقف شیشه ای بر ارتقای جایگاه مدیریتی زنان
-
تاثیر محافظه کاری حسابرس و رتبه بندی موسسات حسابرسی بر مدیریت سود مبتنی بر اقلام تعهدی
-
بهینه سازی فرایند تولید گوگرد از گازهای اسیدی با روش کلاوس در پالایشگاه گازی با استفاده از نرم افزار aspen hysys
-
رابطه شکست خدمات و احیاء خدمات با وفاداری مشتریان
-
بررسی حقوقی و اقتصادی تاثیر تحریم ها بر صنعت گردشگری
سوال خود را در مورد این مقاله مطرح نمایید :