• جزئیات بیشتر مقاله
    • تاریخ ارائه: 1400/12/05
    • تاریخ انتشار در تی پی بین: 1401/01/30
    • تعداد بازدید: 130
    • تعداد پرسش و پاسخ ها: 0
    • شماره تماس دبیرخانه رویداد: 02171053199

    بررسی فرایند تولید عنوان تصویر با مدل cnn-rnn

    برای تولید یک جمله عنوان برای یک تصویر، نیاز است که مباحثی چون پردازش زبان طبیعی پردازش تصویر با یکدیگر تلفیق شوند. در نتیجه استفاده از الگوریتم های شبکه ی عصبی برای این مسئله، موضوعیت پیدا می کند.

    پردازش متن نیاز به الگوریتمی دارد که بتوان با استفاده از متن موجود در فرایند پردازش (یا متن قبلی پردازش شده)، متن های پیش رو (که بناست تولید شود) را پیش بینی و تولید کرد، که نیاز به استفاده از شبکه های عصبی بازگشتی به وجود می آید؛ و همچنین در مبحث پردازش تصویر نیز از الگوریتم شبکه عصبی کانولوشنال، برای استخراج ویژگی های یک تصویر استفاده می شود.

    در نتیجه با تلفیق این دو، به نحوی که نتایج استخراج ویژگی های یک تصویر، در اختیار ورودی های ماژول پردازش متن قرار بگیرد، برای ساخت و پیش بینی عنوان با استفاده از الگوریتم های شبکه ی عصبی، اقداماتی صورت گرفته است. اما برای تولید نتایج دقیق تر به مقدار داده زیاد زیاد برای آموزش و مدل سازی نیاز است، که در این مقاله تمامی نتایج ارائه شده از دقت بالا برخوردار نیستند و برخی دارای خطا هستند. و مقدار خطا در مدل تشکیل شده، پس از 10 مرحله به کمترین مقدار خود یعنی 2.2973 می رسد.

سوال خود را در مورد این مقاله مطرح نمایید :

با انتخاب دکمه ثبت پرسش، موافقت خود را با قوانین انتشار محتوا در وبسایت تی پی بین اعلام می کنم
مقالات جدیدترین ژورنال ها