• تبدیل متن فارسی به زنجیره واجی با استفاده از تحلیلگر صرفی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 1013
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    در مقاله حاضر می کوشیم روشی خودکار برای تبدیل متون فارسی به زنجیره واجی ارائه دهیم. خط فارسی به دلیل دشواری های پردازشی که دارد ورودی مناسبی برای برنامه های پردازش متن به حساب نمی آید. از ویژگی های خط فارسی می توان به عدم نمایش واکه های کوتاه و به دنبال آن موضوع هم نویسه گی، مساله کسره اضافه، فاصله بین اجزای کلمه واحد، فقدان فاصله بین کلمه های مستقل، موضوع جدانویسی و پیوسته نویسی و غیره اشاره کرد. برخورداری خط فارسی از ویژگی های که بشمردیم موجب می شود قبل از انجام هر گونه پردازشی، متون فارسی را به زنجیره واجی تبدیل کنیم. خروجی برنامه تبدیل متن به زنجیره واجی کاربردهای متعددی منجمله در تبدیل خودکار متن به گفتار، واج نویسی صحیح متون، آموزش زبان فارسی به غیر فارسی زبانان، فرهنگ نویسی و غیره دارد. در این مقاله با استفاده از تحلیلگر صرفی پارس-مورف که توسط نگارندگان طراحی و پیاده سازی شده است، متن ورودی از لحاظ صرفی تحلیل شده و اجزای صرفی آن از قبیل پیشوندها، پسوندها، اشتقاق و ترکیب بدست آمده و سپس با استفاده از واژگان زایای زبان فارسی، صورت واجی آنها با هم ترکیب شده و در نهایت صورت واجی متن ورودی به دست می آید.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها