• بازشناسی متن چاپی فارسی بر مبنای جداسازی هوشمند

    جزئیات بیشتر مقاله
    • تاریخ ارائه: 1386/01/01
    • تاریخ انتشار در تی پی بین: 1386/01/01
    • تعداد بازدید: 824
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: -
    یک روش سریع و دقیق برای بازشناسی متن چاپی فارسی با درجۀ تفکیک 300 نقطه بر اینچ معرفی می شود. این روش مبتنی بر جداسازی زیرکلمات به حروف و زیر حروف سازنده آنها بوده و فرایند بازشناسی در چندین مرحله، با استفاده از طبقه بندهای شبکۀ عصبی تقویت شده انجام می گیرد. جداسازی زیرکلمات، همواره یکی از مشکل ترین بخشهای بازشناسی متون فارسی و عربی بوده است. کمترین اشتباه در فرایند جداسازی، موجب گسترش خطا در فرایند کلی بازشناسی می شود. در این مقاله علاوه بر ارائۀ روش ساده و سریع برای جداسازی، با استفاده از نتایج مرحلۀ بازشناسی، خطاهای مرحلۀ جداسازی تصحیح می شود. به عبارتی، سیستم دارای یک حلقۀ بازخورد است که باعث افزایش قابلیت اعتماد آن شده است. داده های هدف در این تحقیق، متون فارسی با قلمهای لوتوس، نازنین و میترا بوده است. البته الگوریتم به گونه ایست که برای سایر قلمها قابل توسعه است. این روش روی 8 صفحه متن فارسی با درجۀ تفکیک 300 نقطه بر اینچ آزمایششده و دقت بازشناسی 99% حاصل شده است.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین رویدادها
مقالات جدیدترین ژورنال ها