بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

قنبری سرخی, علی; حسن پور, حمید; فاتح, منصور

بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

نوع مقاله : مقاله پژوهشی

نویسندگان

¹ دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

² دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

چکیده

امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می‌شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.

کلیدواژه‌ها

20.1001.1.23831197.1398.6.2.4.6

تعداد مشاهده مقاله: 812
تعداد دریافت فایل اصل مقاله: 3,443

بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

دوره 6، شماره 2
اسفند 1398
صفحه 43-59

فایل ها

هم رسانی

ارجاع به این مقاله

آمار

بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

دوره 6، شماره 2اسفند 1398صفحه 43-59

فایل ها

هم رسانی

ارجاع به این مقاله

آمار

دوره 6، شماره 2
اسفند 1398
صفحه 43-59