• ایجاد خودکار نمایه (index) برای تصاویر متنی به زبان فارسی

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1391/01/01
    • تاریخ انتشار در تی پی بین: 1391/01/01
    • تعداد بازدید: 649
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    در سال های اخیر، تشخیص نوری متون فارسی و عربی به طور گسترده ای مورد توجه قرار گرفته است. در این مقاله سعی داریم روشی برای ساخت خودکار نمایه، از تصاویر متنی به زبان فارسی ارائه کنیم. از این رو، ابتدا به تفکیک لغات و خطوط به کمک هیستوگرام های عمودی و افقی پرداخته و برای بهبود کیفیت لغات جدا شده از عملگرهای مورفولوژی استفاده می کنیم، تا ریزفاصله های موجود بین کلمات را حذف  کنیم. سپس هر کلمه بدست آمده را به عنوان تصویر نمونه در نظر می گیریم و از طریق محاسبه ضریب همبستگی آن با سایر کلمات موجود در متن مقایسه می کنیم. در صورت مشابه بودن کلمه ای از متن با تصویر نمونه، آن را به همراه شماره صفحاتی این کلمه ای از متن با تصویر نمونه، آن را به همراه شماره صفحاتی که این کلمه در آنها آورده شده است به عنوان یک ورودی در جدول نمایه درج می کنیم. نتایج حاصل از الگوریتم، نشان دهنده دقت حدود 90 درصد الگوریتم در ایجاد نمایه بر روی متون فارسی است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها