روشی مبتنی بر ماشین یادگیری سریع با هسته غیرخطی برای انتخاب نمونه‌های اولیه در یادگیری چندبرچسبه مقیاس بزرگ

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد

2 دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد

چکیده

با وجود حجم عظیم محتوای چند رسانه‌ای در وب، ذخیره سازی و بازیابی آنها با بکارگیری روش‌های یادگیری موجود با محدودیت ‌هایی از جمله کمبود حافظه مواجه شده است. تاثیر گذاری محدودیت‌های مد نظر در روش‌های یادگیری دارای مرحله آموزش مانند ماشین بردار پشتیبان (SVM) و شبکه های عصبی تا جایی است که امکان بکارگیری این روش‌ها در کاربرد‌های مقیاس بزرگ تقریبا غیر‌ممکن است. روش ماشین یادگیری سریع مبتنی بر هسته غیر‌خطی (KELM) یکی از روش‌های قدرتمند ارائه شده در حوزه یادگیری ماشین است. اساس مرحله یادگیری در این روش مبتنی بر ساخت ماتریس هسته‌ی نمونه‌های برچسب‌دار و محاسبه معکوس آن می‌باشد. از اینرو، بکارگیری این روش در محیط‌های مقیاس بزرگ با وجود تعداد زیاد نمونه‌های برچسب دار امکان‌پذیر نیست. در این پژوهش به منظور حل مشکل مطرح شده در بکارگیری KELM در کاربردهای مقیاس بزرگ، روشی مبتنی بر انتخاب نمونه‌های اولیه با بهره‌گیری از KELM در مقیاس کوچک همسایگی هر نمونه آموزش ارائه شده است. با بکارگیری روش انتخاب نمونه‌های اولیه ارائه شده، حجم مجموعه آموزش کاهش می‌یابد. بنابراین امکان استفاده از روش یادگیری KELM در کاربردهای مقیاس بزرگ فراهم می‌شود. از آنجایی که کاربردهای حوزه چند رسانه ای وب به صورت چندبرچسبه می‌باشند، روش ارائه شده در انتخاب نمونه‌های اولیه، مبتنی بر کاربردهای چندبرچسبه مانند شرح‌گذاری خودکار تصاویر است. نتایج آزمایش‌های تجربی بر روی دادگان چندبرچسبه مقیاس بزرگ NUS-WIDE و نسخه‌های آن مانندObject، Scene و Lite بیانگر کارایی روش ارائه شده در حل محدودیت‌های بکارگیری KELM در کاربردهای چندبرچسبه مقیاس بزرگ با انتخاب نمونه‌های اولیه دارد.

کلیدواژه‌ها