1
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
2
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
چکیده
امروزه آشکارسازی و برچسبزنی اشیاء در تصاویر یکی از چالشهای اساسی در برخی از کاربردهای بیناییماشین میباشد. در سالهای اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکههای عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل میشود. در ادامه شبکهای بهبود یافته از شبکه R-FCN ارائه میشود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسبزنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسبزنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.
قنبری سرخی, علی, حسن پور, حمید, & فاتح, منصور. (1398). بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء. مجله بینایی ماشین و پردازش تصویر, 6(2), 43-59.
MLA
علی قنبری سرخی; حمید حسن پور; منصور فاتح. "بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء". مجله بینایی ماشین و پردازش تصویر, 6, 2, 1398, 43-59.
HARVARD
قنبری سرخی, علی, حسن پور, حمید, فاتح, منصور. (1398). 'بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء', مجله بینایی ماشین و پردازش تصویر, 6(2), pp. 43-59.
VANCOUVER
قنبری سرخی, علی, حسن پور, حمید, فاتح, منصور. بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء. مجله بینایی ماشین و پردازش تصویر, 1398; 6(2): 43-59.