-
بهبود مبتنی بر تخصیص پنهان دریکله برای دسته بندی متون با استفاده از تکنیک های پردازش متن
جزئیات بیشتر مقاله- تاریخ ارائه: 1396/11/30
- تاریخ انتشار در تی پی بین: 1396/11/30
- تعداد بازدید: 524
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
فرایند داده کاوی به زیر شاخه های گوناگونی تقسیم می شود که یکی از این زیر شاخه ها فرایند داده کاوی از متن هاست که به نام پردازش متن نیز شناخته می شود. پردازش متن با استفاده از تکنیک های گوناگون، اطلاعات مفید را از داده های متنی غیرساخت یافته یا نیمه ساخت یافته استخراج می کند. از آن جا که پردازش متن در موقعیت های مختلفی به استخراج دانش از متن می پردازد، تکنیک های گوناگونی برای آن وجود دارد. یکی از این موارد تکنیک ngram است که از طریق پیشینه کلمه، به مدلسازی می پردازد. این تکنیک توانسته است به بهبود کاوش متن کمک کند. در این مقاله با استفاده از روش ngram، اقدام به ساخت مدل موضوعی نمودیم که همزمان با استخراج کلمه های کلیدی سند به دسته بندی آن ها می پردازد. در فرایند مدل سازی از پارامترهای مخفی استفاده می کنیم که این پارامترها شاخص هایی هستند که به مدل کمک می کنند تا با استفاده از پیشینه کلمات و جملات به دسته بندی مطلوب اسناد بپردازد. مجموعه دادهای که در این مقاله استفاده شده است شامل متون نظرسنجی می باشد که در سال 2015 نظرسنجی شده است که این داده ها یکی از داده های مشهور در زمینه دسته بندی متون می باشد. هدف، بهبود روش تخصیص پنهان دریکله است. نتایج روش های مشابه با روش پیشنهادی مقایسه شده است که روش پیشنهادی توانسته عمکرد بهتری را نسبت به روش های قبلی داشته باشد.
مقالات جدیدترین رویدادها
-
استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود
-
بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها
-
تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)
-
رویکردی نوین جهت افزایش آستانه تحمل پذیری خطا در نرم افزار
-
توسعه پایدار روستائی با رویکرد برنامه ریزی در جهت کارآفرینی در گردشگری و صنایع دستی روستائی
-
تعیین شاخص های کمی مکان یابی جهت احداث سد زیرزمینی (مطالعه موردی دشت رامهرمز)
-
بررسی گونه های مخمر در تولید اتانول از آب پنیر در فرآیند ناپیوسته در فرمانتور میکس و بیوراکتور ایرلیفت
-
reduction of nox in fe-edta and fe-nta solutions by an enriched bacterial population
مقالات جدیدترین ژورنال ها
-
مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول
-
مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران
-
واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی
-
بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)
-
بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)
-
بررسی بازاریابی دیجیتال و استراتژی های بازاریابی دیجیتال در ایران
-
اصول و شاخصه های سبک زندگی قرآنی (مطالعه موردی هر یک از اعضاء خانواده)
-
سوء استفاده از کودکان در جرائم از دیدگاه داخلی و بین المللی
-
بررسی ارتباط بین شاخص نفوذپذیری ثانویه (spi) با خورند دوغاب در توده سنگ ساختگاه سد سیمره
-
ارائه یک رویکرد ترکیبی پویا جهت تخصیص منابع در محیط ابری موبایل مبتنی بر الگوریتم های fcm و ژنتیک باینری
سوال خود را در مورد این مقاله مطرح نمایید :