• استخراج بهترین ویژگی از متون فارسی با استفاده از تجزیه و تحلیل مولفه های اصلی با کمک میانگین یادآوری و الگوریتم ژنتیک

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 1252
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    طبقه بندی و استخراج ویژگی متون فارسی به دلیل وجود ویژگی های بسیار، تکراری و بی اهمیت، فرآیندی بسیار سخت و پیچیده خواهد بود. از آنجا که این موضوع به صورت محدود مورد مطالعات قرار گرفته است، هدف از مقاله حاضر، استخراج بهترین ویژگی های متن فارسی با استفاده از تجزیه و تحلیل مولفه های اصلی (pca) با کمک معیار میانگین یادآوری و الگوریتم ژنتیک خواهد بود. این مطالعه با در اختیار داشتن مجموعه داده های استاندارد روزنامه همشهری که در پنج طبقه تقسیم شده بودند، انجام شد. با استفاده از روش وزن دهی ویژگی مبتنی بر اطلاعات کلاس در حوزه طبقه بندی مستندات (tecrf) و روش های طبقه بندی نزدیک ترین همسایه (knn) و بیزین در روش پیشنهادی، نتایج بدست آمده نشان داد که دقت طبقه بندی متون فارسی به صورت قابل توجهی افزایش و مدت زمان تست با ویژگی های استخراج شده با روش پیشنهادی کاهش خواهد یافت.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها