%0 Journal Article %T بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء %J مجله بینایی ماشین و پردازش تصویر %I انجمن بینایی ماشین و پردازش تصویر ایران %Z 2383-1197 %A قنبری سرخی, علی %A حسن پور, حمید %A فاتح, منصور %D 2020 %\ 02/20/2020 %V 6 %N 2 %P 43-59 %! بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء %K ‏ آشکارسازی و شناسایی اشیاء %K یادگیری عمیق %K R-FCN %K ماشین بردار پشتیبان دودویی فازی %K اختلاف کوشی-شوارتز %R %X امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می‌شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است. %U https://jmvip.sinaweb.net/article_80238_4e49ef482e899a342f2b99acffa041be.pdf