• خوشه بندی متون مبتنی بر مرکز دسته با استفاده از روش svd و بهره گیری از نقاط همسایگی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 2036
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    دسته بندی متن، یکی از شاخه هایی است که امروزه توجه گسترده ای را به خود معطوف داشته است که در آن متن های با محتویات مشابه یک دسته اختصاص داده می شوند. در این مقاله روشی ترکیبی از خوشه بندی مبتنی بر مرکز دسته ها،k-means ، به همراه روش svd مورد مطالعه قرار گرفته که عمل خوشه بندی در آن، با معرفی دو مفهوم جدید نقاط همسایگی و ارتباط، انجام پذیرفته است. استفاده از svd می تواند با حفظ ساختار زیربنایی در فضای ویژگی، اثر نویز را کاهش دهد. با استفاده از مفاهیم ارائه شده، روشی جهت انتخاب مراکز اولیه دسته ها و رابطه ای جهت محاسبه مشابهت بردار متن ها با این مفاهیم معرفی می گردد. در انتها سه آزمایش مختلف بر روی یک مجموعه از پنجاه و شش متن انجام گرفته است. در آزمایش ابتدایی با استفاده از الگوریتم مقدماتی k-means به نتیجه 57.14 درصد سپس در آزمایش دوم با اعمال مفاهیم همسایگی و پیوند به نتیجه 87.5 درصد و آزمایش سوم با استفاده ترکیبی از مفاهیم ارائه شده در آزمایش دوم و الگوریتم svd دسته بندی متون را به 92.86 درصد بهبود می بخشد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین ژورنال ها