• خوشه بندی جملات فارسی مبتنی بر الگوریتم های هوش جمعی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 1239
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    خوشه بندی یکی از مسائل مهمی است که امروزه بسیاری از محققین در زمینه های مختلف به آن پرداخته اند. تاکنون الگوریتم های کلاسیک زیادی در این زمینه ارائه شده است. که اغلب این روش ها دارای ناپایداری بوده و همچنین پارامترهای آن ها محدود به انتخاب کاربر می باشد. از کاربردهای خوشه بندی می توان به خوشه بندی متون و اسناد در موضوعات خلاصه سازی متون و بازیابی اطلاعات یاد کرد. در خوشه بندی جملات یک متن برای مشخص شدن جملات مشابه، نمی توان از روش مشابه آن (دسته بندی متون مشابه) استفاده کرد. بردارهایی به طول m و با مقادیر صفر بسیار زیاد پدید خواهد آمد. برای حل این مشکل، روشی جدید مبتنی بر pso برای خوشه بندی جملات یک متن معرفی شده است. به طوریکه به جای استفاده از فاصله اقلیدستی و فاصله کسینوسی، از یک معیار جدید در محاسبه فاصله دو جمله استفاده شده است. معیاری که در آن؛ ارتباط معنایی کلمات با استفاده از ارتباطات آنها در متن در نظر گرفته می شود. همچنین تعیین تعداد خوشه های بهینه یکی دیگر از کارهای انجام شده در این مقاله است. برای ارزیابی یک مجموعه از خبرهای ورزشی فارسی انتخاب شده است. نتایج حاصل از ارزیابی روش پیشنهادی نشان می دهند که استفاده از خوشه بندی pso معنایی، با تعیین تعداد خوشه های مطلوب، دقت بهتری را در خوشه بندی جملات در مقایسه با روش های دیگر، دارد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها