انجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11978320210923A general descriptor based-on weighted local binary pattern for
infrared images retrievalارائه یک توصیفگر عمومی مبتنی بر الگویدودوییمحلی وزندار به منظور بازیابی تصاویرمادونقرمز112122764FAمحمد حسین شکورگروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه اراک، ایران.0000-0001-8672-5181Journal Article20210118Local Binary Pattern (LBP) is one of popular texture images descriptors. It is used to extraction features of texture images for classification. However, in this paper a new version of LBP is proposed that is not used for this purpose. The proposed descriptor is used for image retrieval. In other words it can be compare to Scale Invariant Features Transform (SIFT). In term of speed, the proposed method outperforms the SIFT. In addition, in this paper it is used for Infrared images retrieval. These images are low quality and low contrast and if they are used without any pre processing and enhancement, SIFT descriptor versions cannot extract good features of them. The proposed method can provide better result with higher speed. The proposed method have been compared to center symmetric LBP (CS-LBP) and SIFT by using both infrared images and standard image data-sets.یکی از توصیفگرهای مهم بافتی تحت عنوان الگویدودوییمحلی می باشد. الگویدودوییمحلی در استخراج ویژگیهای بافتی کاربرد زیادی دارد. در این مقاله نوعی از الگویدودوییمحلی ارائه شده است که از آن نه به عنوان توصیفگر بافت، بلکه به عنوان یک توصیفگر عمومی استفاده شده است. یعنی همانند توصیفگر تبدیل مستقل از مقیاسویژگی (SIFT) عمل می کند. روش پیشنهادی بر اساس میزان اختلاف نقطه مرکزی با نقاط همسایگی وزن های لازم را تولید می کند و این مقادیر وزن در مقادیر الگوی دودویی ضرب شده و استفاده می شود. ضمن اینکه بجای الگوی دودویی محلی برای کاهش تعداد ویژگیها از الگوی دودویی محلی متقارن مرکزی CS-LBP استفاده شده است. مزیت روش پیشنهادی نسبت به SIFT سرعت بالای آن است. ضمن اینکه بجای تصاویر عادی از تصاویر دوربین های مادون قرمز استفاده شده است. این تصاویر نسبت به تصاویر معمول دارای لبه هایی تارتر هستند و بازیابی آنها با توصیفگرهای عمومی عملاً نتایج خوبی تولید نمی کند. نتایج پیاده سازی نشان می دهد که روش پیشنهادی هم از لحاظ سرعت و هم از لحاظ دقت نسبت به توصیفگرهای عمومی مانندSIFT بهتر عمل می کند ضمن اینکه از روش الگوی دودویی محلی متقارن مرکزی هم دقت بالاتری دارد.https://jmvip.sinaweb.net/article_122764_59eebb242927af4bfe3ec38e7d6fe4e4.pdfانجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11978320210923A new descriptor for biometric user authentication systems based on optimized features of finger knuckle print and fingernailارائه یک توصیفگر جدید بهمنظور استفاده در سیستمهای شناسایی هویت زیستی مبتنیبر ویژگیهای بهینهشده چروکیدگی انگشتان دست و ناخن1325122765FAحدیث حیدریدانشجوی دکتری مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر دانشگاه رازیعبداله چاله چالهگروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر دانشگاه رازی0000-0002-7217-905XJournal Article20210118In this paper a new texture descriptor is presented for biometric authentication systems based on hand dorsal texture characteristics. First, different hand images are collected using an acquisition device, then the images are mapped from RGB color space to YUV and the five fingers are isolated from images with thresholding of the U component for skin detection. Utilizing the center of gravity, length and direction of the fingers, the finger knuckle print and nail regions are determined. Then, the texture features of finger knuckle are described using four directional patterns based on statistical thresholding. Moreover, the features of nails are described using discrete wavelet transform. In addition, utilizing a cost function in the evolutionary particle swarm optimization algorithm, a set of significance coefficients is applied to the textural features of the hand, and as a result, these features are optimized. Finally, using the d1 distance measurement criterion, the similarity of the images has been calculated and the identity of individuals has been identified with the recognition rate of 92.13%. The experimental results on a set of images collected by the authors, called FKP_Nail, show that the proposed method is more accurate and faster than known existing methods while it uses simpler calculations.در این مقاله یک توصیفگر بافتی جدید به منظور استفاده در سیستم های شناسایی هویت زیستی مبتنی بر مشخصه ی بافت پشت دست ارائه می شود. ابتدا تصاویر دست افراد مختلف توسط یک وسیله اخذ تصاویر جمع آوری، سپس با نگاشت تصاویر از فضای رنگی RGB به YUV و آستانه گیری مؤلفه U، پیکسلهای پوست تشخیص داده شده و پنج انگشت از تصویر مجزا میگردند. سپس با استفاده از مرکز ثقل، طول و جهت انگشتان، نواحی چروکیدگی انگشتان و ناخن استخراج می شوند. ویژگی های بافتی چروکیدگی انگشتان با استفاده از توصیفگر پیشنهادی الگوهای چهارجهتی مبتنی بر آستانه گیری آماری و ویژگی های ناخن نیز با استفاده از تبدیل موجک گسسته تا سه سطح استخراج می شوند. به علاوه، با تعیین یک تابع هزینه در الگوریتم تکاملی بهینه سازی دسته ذرات، مجموعه ای از ضرائب اهمیت به ویژگی های بافتی دست اعمال شده و درنتیجه این ویژگی ها بهینه می گردند. در نهایت با بهره گیری از معیار اندازه گیری فاصله d1میزان مشابهت تصاویر محاسبه و هویت اشخاص با دقت 13/92% شناسایی شده است. نتایج آزمایش ها روی مجموعه تصاویر تهیه شده توسط نگارندگان با نام FKP_Nail، نشان میدهد که روش ارائه شده در مقایسه با روش های شناخته شده موجود دقت و سرعت بهتری داشته و از محاسبات ساده تری نیز استفاده می کند. https://jmvip.sinaweb.net/article_122765_2dbe838a34e136f27bae6152914ec3f5.pdfانجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11978320210923An Efficient Method for Early Glaucoma Screening based on Calculating Optic Cup to Disc Ratio Using Convolutional Neural Networksیک روش کارا برای غربالگری اولیه بیماری گلوکوم بر اساس محاسبه نسبت کاپ به دیسک نوری با استفاده از شبکههای عصبی کانولوشنی2743126000FAفاطمه معادیدانشآموخته کارشناسی ارشد مهندسی برق گرایش مخابرات-سیستم، دانشگاه بینالمللی امام خمینی(ره)، قزوین، ایرانندا فرجیگروه مهندسی برق، دانشکده فنی و مهندسی، دانشگاه بینالمللی امام خمینی(ره)، قزوین، ایرانمحمدرضا حسن نژاد بی بالانگروه مهندسی برق، دانشکده فنی و مهندسی، دانشگاه بینالمللی امام خمینی(ره)، قزوین، ایرانJournal Article20210210Early diagnosis and treatment of glaucoma can prevent the progression of this disease and the sudden loss of vision. Glaucoma affects the optic disc and optic cup located inside the optic disc. In this paper, first, the optic disc is localized and then segmentation of optic disc and cup is performed to diagnose based on the optic cup to disc ratio (CDR). A Faster Region-based Convolutional Neural Network (Faster-RCNN) with the pre-trained ResNet50 network is used for the optic disc localization step. The segmentation step is performed by the modified U-Net architecture using the SE-ResNet50 network as its encoding layers, and finally CDR is evaluated. The Drishti-GS1 and RIM-ONE v3 databases are used to train and test the proposed method and the MESSIDOR database is only used in the test phase. In addition, for segmentation of optic disc and cup, two approaches are proposed to consider the optic disc and cup annotations in the Drishti-GS1 data set’s ground truth. In the second proposed approach and according to the F<sub>1</sub>-score criteria, the result of optic cup and disc segmentation for Drishti-GS1 data set is 0.93 and 0.97, respectively, for RIM-ONE v3 data set is 0.79 and 0.95, respectively, and for MESSIDOR data set is 0.84 and 0.93, respectively, which is competitive with other works.تشخیص و درمان بهموقع بیماری گلوکوم میتواند از پیشروی این بیماری و از دستدادن ناگهانی بینایی جلوگیری کند. گلوکوم دیسک و کاپ نوری را که درون دیسک قرار دارد تحت تأثیر قرار میدهد. در این مقاله ابتدا به محلیسازی دیسک نوری پرداخته شده و سپس قطعهبندی دیسک و کاپ نوری بهمنظور تشخیص براساس نسبت کاپ به دیسک نوری (CDR) انجام میشود. برای مرحله محلیسازی دیسک از شبکه عصبی کانولوشنی مبتنی بر ناحیه سریعتر (Faster-RCNN) با شبکه پیشآموزشدیده ResNet50 استفاده میشود. مرحله قطعهبندی توسط معماری U-Net اصلاحشده با استفاده از شبکه SE-ResNet50 در قسمت کدگذار آن اجرا شده و در نهایت CDR مورد ارزیابی قرار میگیرد. پایگاههای داده Drishti-GS1 و RIM-ONE v3 برای آموزش و تست روش پیشنهادی و دستهداده MESSIDOR صرفا در مرحله تست بکار رفته است. همچنین بهمنظور قطعهبندی کاپ و دیسک نوری دو رویکرد برای درنظرگرفتن حاشیهنویسی کاپ و دیسک نوری در حقیقت مبنای دستهداده Drishti-GS1 پیشنهاد میشود. در رویکرد پیشنهادی دوم و طبق معیار F<sub>1</sub>-score، نتیجه قطعهبندی کاپ و دیسک نوری برای دستهداده Drishti-GS1 بهترتیب 0.93 و 0.97، برای دستهداده RIM-ONE v3 به ترتیب 0.79 و 0.95 و برای دستهداده MESSIDOR به ترتیب 0.84 و 0.93 بدست آمده که قابل رقابت با سایر کارها است.https://jmvip.sinaweb.net/article_126000_5e3098307eed1365c4d0c783abbd325a.pdfانجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11978320210923Detection of the Location and Angle of Saffron Flowers using Deep Convolutional Networksتشخیص مکان و زاویه گل های زعفران در تصویر با استفاده از شبکه های همگشتی عمیق4555126001FAمحمدرضا محمدیدانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایرانمهرداد کرمیشرکت سامانه های هوشمند کشاورزی والی، تهران، ایرانJournal Article20210210Automatic detection of the angle and position of saffron flowers is an essential step for automatic processing of saffron flowers. Due to the diversity of saffron flowers, traditional algorithms can not yield acceptable accuracy. In this paper, an algorithm based on the deep convolutional networks is proposed. In the proposed architecture, the image is divided into a number of small square areas, and in each region, the existence of the flower is estimated. Also, the relative location suitable for cutting the saffron flower is estimated relative to the center of the region. To estimate the angle, the 360-degree range is first divided into several parts and the angle of the flower is classified to one of the values. Then, the relative angle with the center of the region is estimated. In order to evaluate the performance of the proposed algorithm, a dataset of 163 images and 3035 flowers has been collected, and the parameters for each flower are annotated by an expert. The evaluation of the proposed algorithm shows that more than 95% of the flowers are correctly estimated.تشخیص خودکار مکان و زاویه برش گل های زعفران یک گام اساسی برای فرآوری خودکار گل زعفران است. با توجه به تنوع موجود میان گل های زعفران، الگوریتم های سنتی نمی توانند دقت قابل قبول را نتیجه دهند. در این مقاله، یک الگوریتم مبتنی بر شبکه های همگشتی عمیق برای حل این مسئله پیشنهاد شده است. در معماری پیشنهادی، تصویر به تعدادی ناحیه مربعی کوچک تقسیم می شود و در هر ناحیه وجود محل برش گل زعفران تخمین زده می شود. همچنین، محل نسبی مناسب برای برش گل زعفران نسبت به مرکز ناحیه تخمین زده می شود. برای تخمین زاویه، ابتدا محدوده 360 درجه به تعدادی قسمت تقسیم می شود و زاویه گل به یکی از مقادیر اختصاص می یابد. سپس، زاویه نسبی نسبت به مرکز ناحیه تخمین زده می شود. به منظور ارزیابی عملکرد الگوریتم پیشنهادی، یک پایگاه داده شامل 163 تصویر و 3035 گل جمع آوری شده است و پارامترهای هر گل توسط یک خبره مشخص شده است. ارزیابی الگوریتم پیشنهادی نشان می دهد که پارامترهای بیش از 95% گلها به درستی تخمین زده شده اند.https://jmvip.sinaweb.net/article_126001_b618c5a97f5a9fb9bc4ae3c1994cb20d.pdfانجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11978320210923Unsupervised Feature Learning for Blind Quality Assessment of Super-Resolved Imagesیادگیری غیرنظارتی ویژگی برای ارزیابی کیفیت کور تصاویر فراتفکیکپذیر5767128577FAمریم کریمیگروه علوم کامپیوتر، دانشکده علوم ریاضی، دانشگاه شهرکرد، شهرکرد، ایرانمنصور نجاتیدانشآموخته دکتری برق، دانشگاه صنعتی اصفهانJournal Article20210329Image super-resolution is a classic image processing issue that aims to create high-resolution images from low-resolution images. Although many algorithms in this field have been proposed so far, effective quality evaluationof such images remains a challenging research area. Conventional image quality assessment measures are not sufficiently consistent with subjective judgments on these images. Therefore, it is very important to provide specific quality assessment methods for image super-resolution. In this paper, we propose a no-reference quality evaluation method for super-resolved images that, by learning a dictionary on high-resolution images and representing super-resolved blocks, produce local features that can describe super-resolution degradations well. These features are pooled togetherby a suitable pyramidal approach and produce a global feature vector of the image. These vectors and subjective quality scores are ultimately used to train a regression model. Experimental results show that this method is not only simple and high speed, but also does not require large volumes of training data and is more efficient than existing methods.افزایش تفکیکپذیری تصاویر، یک مسئله کلاسیک در زمینه پردازش تصویر است که هدف آن ایجاد تصاویر با تفکیکپذیری بالا از تصویر با تفکیکپذیری پایین است. الگوریتمهای بسیاری در این زمینه تاکنون ارائه شدهاند. با این حال، ارزیابی مؤثر کیفیت این نوع تصاویر همچنان بعنوان یک زمینه تحقیقاتی چالش برانگیز باقی مانده است. روشهای معمول ارزیابی کیفیت تصویر، همخوانی کافی با معیارهای ادراکی ندارند. لذا ارائه روشهای ارزیابی کیفیت خاصِ تصاویر فراتفکیکپذیر، اهمیت بالایی دارد. در این مقاله ما یک روش ارزیابی کیفیت بدون مرجع برای تصاویر فراتفکیکپذیر ارائه میکنیم که با یادگیری بدون برچسب یک کتاب اتمها روی تصاویر مرجع با تفکیکپذیری بالا و بازنمایی بلوکهای تصاویر فراتفکیکپذیر با این کتاب، ویژگیهای محلی تولید مینماید که قادرند تخریبهای ناشی از افزایش تفکیکپذیری را به خوبی توصیف نمایند. این ویژگیها با یک رویکرد مناسب هرمی، تلفیق شده و بردار ویژگی سراسری از تصویر تولید میکنند. این بردارها و امتیازات کیفیت چشمی در نهایت، جهت آموزش یک مدل رگرسیون مورد استفاده قرار میگیرند. نتایج تجربی نشان میدهند که این روش در عین سادگی، سرعت و عدم نیاز به حجم بالای داده آموزشی، کارایی بهتری نسبت به روشهای موجود دارد.https://jmvip.sinaweb.net/article_128577_1d79b4d8b951ef5e1f19b614ab0cd637.pdfانجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11978320210923A Computer Vision Algorithm based on Dynamic Neural Fields for Multiple-Object Trackingاستفاده از میدان های عصبی پویا در یک الگوریتم بینایی ماشین به منظور ردگیری همزمان اهداف6981129449FAشیوا کامکاردانش آموخته دکتری مهندسی کامپیوتر، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی خواجه نصیرالدین طوسیحمید ابریشمی مقدمگروه مهندسی پزشکی
دانشکده مهندسی برق
دانشگله صنعتی خواجه نصیررضا لشگریپژوهشکده علوم و فناوری های پزشکی، دانشگاه شهید بهشتیJournal Article20210421Tracking multiple objects (MOT) is an important topic in almost all computer vision-related areas. One of the most vital challenges in front of MOT’s algorithms is data association, particularly when partial or complete occlusions occur. On the other hand, the human can handle this challenge in everyday scenarios for example while driving a car on a highway or riding a bicycle. Accordingly, we used a brain-inspired method to propose an MOT algorithm that can overcome the above challenge. The proposed method is based on dynamic neural field as a brain-inspired algorithm that can mimic both neural and cognitive functions of the brain. Besides, we benefited from computer vision techniques to find targets and extract features such as their locations, directions, and velocities. We applied our method on an online dataset containing videos recorded from natural movements of zebrafish larvae. Evaluation results using two metrics MOTA and MOTP showed that the proposed method has a promising performance compared to the state-of-the-art algorithms. It can associate all information correctly both in the presence and absence of occlusion events.ردگیری همزمان چند شیء یکی از موضوعات مهم در زمینه بینایی ماشین و پایه کاربردهای بسیاری مانند انواع سامانه های نظارتی انسانی و حیوانی است. از اصلیترین چالش های الگوریتم های این حوزه، مرتبط سازی داده ها به ویژه هنگام بروز انسداد می باشد. از آنجا که انسان ها عملکرد مناسبی در مواجهه با این چالش دارند، انتظار میرود استفاده از الگوریتم های ملهم از مغز در ردگیری همزمان اهداف بتواند به بهبود کارایی این گونه از سامانه ها منجر شود. میدان های عصبی پویا سازگاری بالایی با عملکرد نورونی و شناختی مغز انسان دارند. ما در این مقاله از این میدان ها بهره بردیم تا مانند حافظه کاری انسان در نگهداری و پردازش اطلاعاتی مانند مکان اشیاء، جهت و سرعت آنها ایفای نقش کنند. استخراج این اطلاعات با استفاده از شگردهای بینایی ماشین صورت میگیرد. ارزیابی این روش با مقایسه عملکرد آن با روشهای اخیرا توسعه داده شده روی مجموعه داده حاوی ویدیوهای ضبط شده از حرکات آزادانه لاروهای قزل آلا که در دسترس همگان قرار دارد انجام شده است. نتایج نشان داد که روش پیشنهادی نه تنها از روشهای رقیب عملکرد بهتری دارد، بلکه تقریبا در همه موارد به ویژه بعد از انسداد قادر است مرتبط سازی داده ها را به درستی انجام دهد.https://jmvip.sinaweb.net/article_129449_55b4147e9d513c0d845cc0bd3a69171a.pdf