• ارائه رویکرد بدون ناظر در محاسبه شباهت معنایی اسناد متنی کوتاه

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1392/07/24
    • تاریخ انتشار در تی پی بین: 1392/07/24
    • تعداد بازدید: 1229
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
     بخش قابل توجهی از اطلاعات در دسترس، در پایگاه داده های متنی ذخیره شده است. به طور معمول تنها بخش کوچکی از اسناد در دسترس، برای یک فرد یا کاربر مناسب است. از این رو تولید پرس و جوی مناسب سندی، برای تحلیل و استخراج اطلاعات مفید از اسناد متنی، مشکل است. این امر اهمیت موضوع شباهت اسناد متنی را دو چندان می کند. انواع مختلفی از روش های تطبیق لغوی، برای تعیین شباهت بین اسناد ارائه شد که تا یک حد خاصی موفق عمل می کردند ولی قادر به تشخیص شباهت معنایی بین دو متن نبودند. از این رو، رویکردهای شباهت معنایی مطرح شد که از میان آنها می توان روش های مبتنی بر پیکره و روش های مبتنی بر پایگاه دانش مانند وردنت را نام برد. هدف ما این است که در حوزه ی مدل های شباهت معنایی و مبتنی بر پایگاه دانش وردنت، با ارائه یک رویکرد بدون ناظر، میزان شباهت بین اسناد انگلیسی را با دقت مناسبی محاسبه کنیم؛ برای این منظور، از مدل گرافی بهره می بریم و برای ارزیابی، از مجموعه داده ی microsoft research paraphrase corpus  استفاده می کنیم. ارزیابی انجام شده، عملکرد مناسب رویکرد پیشنهادی را نشان می دهد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها