-
مروری بر مفاهیم و انواع روش های داده کاوی در کلان داده
جزئیات بیشتر مقاله- تاریخ ارائه: 1396/11/30
- تاریخ انتشار در تی پی بین: 1396/11/30
- تعداد بازدید: 1347
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
با گسترش علوم در دنیای امروزی، حجم انبوهی از داده ها به وجود آمده است و در هر لحظه تعداد زیادی داده تولید می شود. جهت استخراج و کشف دانش از این داده ها، باید بتوان آن ها را ذخیره و پردازش کرد. داده کاوی یکی از روش هایی است که اطلاعات مفید و روابط مخفی بین داده ها را استخراج می کند ولی به علت حجم بالا و ساختارهای متنوع داده های حجیم امروزی، نمی توان از این روش ها جهت استخراج دانش استفاده کرد. هم چنین ذخیره سازی و پردازش چنین حجمی از داده ها با روش های معمول و قدیمی از نظر زمان و هزینه مقرون به صرفه نیست. بنابراین یا باید ساختار الگوریتم های داده کاوی تغییر کند و یا با روش های جدیدی جایگزین شوند. داده های حجیم به دو صورت دسته ای و جریان های در حال حرکت وجود دارند که باید بتوان با استفاده از موازی سازی سخت افزاری و نرم افزاری و پردازش های جریانی، اطلاعات مفید را از آن ها استخراج کرد. در حال حاضر مهم ترین مدل برای پردازش داده های حجیم، مدل نگاشت- کاهش است که توسط شرکت های زیادی برای پردازش داده هایشان استفاده می شود. نسخه متن باز نگاشت-کاهش توسط هدوپ ارائه شد. در این مقاله ابتدا سیر تکاملی انواع پردازش ها روی داده های حجیم مورد بررسی قرار گرفته و سپس روش های تجزیه و تحلیل این داده ها معرفی شده است و در نهایت الگوریتم k-means که یکی از مهم ترین روش های خوشه بندی است در محیط هدوپ پیاده سازی شده است.
مقالات جدیدترین رویدادها
-
استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود
-
بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها
-
تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)
-
تأثیر برنامه ریزی استراتژیک آموزشی بر رشد مهارت های زبان عربی برای دانش آموزان کلاس ششم (نمونه مدارس المصطفی – لبنان)
-
مقایسه اثربخشی دینوپروستون و اکسی توسین با دوز بالا برای القای دردهای زایمانی در حاملگی ترم و پس از ترم
-
محتوای اطلاعاتی سود تقسیمی و واکنش سهامداران
-
فرم کالبدی ساختمان بر اساس معیار ماهانی در شهر سراب
-
exponential approximation of the heidler function for the reproduction of lightning current waveshapes
مقالات جدیدترین ژورنال ها
-
مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول
-
مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران
-
واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی
-
بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)
-
بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)
-
تاثیر نقش تعدیلگر مالکیت مدیریتی بر ارتباط بین سازوکارهای حاکمیت شرکتی و افشای اطلاعات سرمایه انسانی
-
بررسی شیوع مصرف الکل در ایران از منظر جامعه شناسی جنایی
-
پیش بینی اضطراب کودکان بر اساس تنظیم هیجانات و تاب آوری در دوران شیوع کرونا ویروس (کووید-19)
-
evaluating the geotechnical and geophysical characteristics of expanding districts in tehran using field experiments
-
quantum chemistry calculations based on the density functional theory on diazinon pesticides
سوال خود را در مورد این مقاله مطرح نمایید :