• مقایسه ی خوشه بندی متن های یک پیکره ی موازی فارسی – انگلیسی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1393/09/05
    • تاریخ انتشار در تی پی بین: 1393/09/05
    • تعداد بازدید: 906
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    خوشه بندی متن در زمینه های مختلف پردازش زبان طبیعی کاربردهای فراوان دارد. تاکنون پژوهش های مختلفی در این زمینه برای اسناد زبان های مختلف، از جمله فارسی و انگلیسی، انجام شده است. هدف این پژوهش مقایسه ی خوشه بندی متن های هم طراز فارسی و انگلیسی می باشد. در این پژوهش پس از استخراج بردارهای ویژگی با روشی یکسان از جمله های هم طراز دو زبان فارسی و انگلیسی، و اعمال روش pca به این بردارها، با استفاده از روش k – میانگین خوشه بندی انجام شده است. نتایج حاصل از مقایسه ی خوشه های این دو زبان نشان داد که تفاوت های میان دو زبان فارسی و انگلیسی بر کیفیت خوشه بندی متن ها تاثیر می گذارد. در این آزمایش ها خوشه های حاصل از هیچ یک از زبان های فارسی و انگلیسی بر دیگری برتری کامل نداشتند. این امر نشان می دهد که باید بهترین روش خوشه بندی متناسب با ویژگی های هر زبان اتخاذ شود و روشی که برای یک زبان مناسب است الزاما برای زبان دیگر نیز انتخاب مناسبی نمی باشد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین ژورنال ها