@article { author = {Azadipour ghahestani, Farzaneh and Rashedi, Esmat}, title = {Hand gesture recognition for human computer interaction using motion trajectory coding and artificial neural network}, journal = {Journal of Machine Vision and Image Processing}, volume = {3}, number = {2}, pages = {13-22}, year = {2016}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {Human hand movements are used in the non-verbal interaction between human and computers. Intuitive and natural hand movements is the most important factor motivating researchers to use the hands to improve the human-computerinteraction. In this paper, for hand gesture recognition, hand as the only moving object in the video is detectedusing the difference between frames. After that, hand movement feature vector is extracted. This vector is used to detect hand gesture using artificial neural network. Two methods are proposed for feature-vector extraction. The first method codes themotion trajectory of the final hand pixel in the frames. The second method uses two angle histograms. Identifying six different gestures with recognition rate of 95.54 percent using the first method and 91.53 percent using the second method, shows the efficiency of the proposed system. Also, the comparison between the proposed feature vectors with a conventional method shows the superiority of theproposed methods in terms of accuracy, the number of features, and classifier training time.}, keywords = {Hand Gesture Recognition,Hand Detection,hand motion trajectory coding,Angle Histogram,Artificial Neural Network}, title_fa = {تشخیص حرکات دست برای تعامل انسان و رایانه با استفاده از کدگذاری خط سیر حرکت و شبکه عصبی مصنوعی}, abstract_fa = {حرکات دست انسان حالتی از تعامل غیرکلامی است که در ارتباط بین انسان و رایانه مورد استفاده قرار می‌گیرد. شهودی و طبیعی بودن حرکات دست مهمترین عامل ایجاد انگیزه در محققان است که دست‌ها را برای بهبود تعامل بین انسان و رایانه مورد استفاده قرار دهند. در این مقاله جهت تشخیص حرکت دست، با استفاده از اختلاف فریم ‌ها، دست به عنوان تنها شی متحرک در تصاویر جدا شده است. پس از آن، بردار ویژگی حرکت دست استخراج شده است. این بردار ویژگی به عنوان ورودی شبکه عصبی مصنوعی جهت طبقه‌ بندی حرکات انتقالی دست استفاده شده است. برای استخراج بردار ویژگی دو روش ارائه شده است. بردار ویژگی اول حاصل از کدگذاری خط سیر انتهایی‌ ترین پیکسل دست در طی فریم‌ ها است. بردار ویژگی دوم، از دو هیستوگرام زاویه‌ ای  برای کدگذاری دست استفاده می‌کند. شناسایی شش حرکت مختلف دست در داده‌ های آزمایشی با نرخ بازشناسی 95/54 درصد با استفاده از بردار ویژگی اول و تشخیص این حرکات با نرخ بازشناسی 95/53 توسط بردار ویژگی دوم، کارایی بردارهای ویژگی پیشنهادی در تشخیص حرکات دست را نشان می‌ دهد. همچنین مقایسه‌ ی بردارهای ویژگی پیشنهادی با بردار ویژگی یک روش متداول، برتری روش‌ های پیشنهادی را از نظر دقت، تعداد ویژگی‌ها و زمان آموزش طبقه‌ بند نشان می‌ دهد.}, keywords_fa = {تشخیص حرکات انتقالی دست,تشخیص دست,کدگذاری خط سیر حرکت دست,هیستوگرام زاویه ای,شبکه عصبی مصنوعی}, url = {https://jmvip.sinaweb.net/article_16712.html}, eprint = {https://jmvip.sinaweb.net/article_16712_3f49e24a2fb2672f06d179531be047c6.pdf} } @article { author = {Mofidi, Nafiseh and Ahmadyfard, Alireza}, title = {Multi Image Super Resolution in Presence of Noise by Determining Weighting Coefficients in Map Estimator}, journal = {Journal of Machine Vision and Image Processing}, volume = {3}, number = {2}, pages = {23-38}, year = {2016}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {In order to enhance image resolution and overcome the physical limitations of imaging systems, image super-resolution (SR) is proposed. In SR technique, a high resolution (HR) image is produced by fusing a sequence of low-resolution (LR) images.Since many recent approaches seeking an SR algorithm suppresses noise whilepreserving edges, in this paper, based-upon the statistical techniques, we have proposed an adaptive algorithmwhich is robust in the presenceof Gaussian noise -which has a high detrimental effect on image quality- and moreover, shows a good performance comparing to the other existing methods.In this adaptive algorithm we introducea set of weighting coefficients, which control the contribution between the dataerror and regularization terms in each of the estimated HR pixels. These coefficients are determined according to the neighbors information of the estimated pixel. Experimental results from both synthetic and real images confirm that theproposed algorithm outperforms the other methods.}, keywords = {Super-resolution,M-estimation,Adaptive Weighting,BEP Regularization term,Edge Map Matrix}, title_fa = {افزایش تفکیک‌پذیری چند تصویری در حضور نویز با تعیین تطبیقی وزن جمله‌ها در تخمینگر MAP}, abstract_fa = {به منظور ارتقاء توان تفکیک‌پذیری تصویر و غلبه بر محدودیت‌های فیزیکی سیستم‌های تصویربرداری روش فراتفکیک‌پذیری تصویر مطرح می‌گردد. در این روش یک تصویر با تفکیک‌پذیری بالا از صحنه به کمک تلفیق رشته‌ای از تصاویر با تفکیک‌پذیری پایین صحنه، بازسازی می‌گردد. از آنجایی‌که رویکرد بسیاری از روش‌های فراتفکیک‌پذیری که اخیراً مورد استفاده قرار می‌گیرند بازسازی تصویر حذف نویز شده با تاکید بر حفظ لبه‌ و جزئیات‌ است، در این مقاله بر مبنای الگوریتم‌های آماری، روشی تطبیقی پیشنهاد شده است که نسبت به نویز گوسی که موثرترین نویز تخریب‌کننده کیفیت تصویر است مقاوم بوده و دارای عملکرد مطلوبی نسبت به سایر روشهای مطرح شده است. در این روش تطبیقی، با معرفی ضرایبی جدید، اثرات نسبی جمله خطای داده و جمله تنظیم را در هر پیکسل تصویر تخمین زده شد‌ه ی با تفکیک‌پذیری بالا، کنترل می‌نماییم. این ضرایب با توجه به اطلاعات همسایگان پیکسل موردنظر تعیین می گردد. آزمایش‌های انجام شده بر روی تصاویر ساخته شده و تصاویر واقعی نیز، عملکرد خوب الگوریتم پیشنهادی را نسبت به سایر روشها تصدیق می‌کند.}, keywords_fa = {فراتفکیک‌پذیری,تخمین-M,وزن تطبیقی,جمله تنظیم BEP,ماتریس شاخص لبه}, url = {https://jmvip.sinaweb.net/article_17547.html}, eprint = {https://jmvip.sinaweb.net/article_17547_90771a7c6adb4d965286dfc93359057f.pdf} } @article { author = {Kargar-Shooroki, Hamid and Zare Chahooki, Mohammad Ali}, title = {A prototype selection method based on kernel extreme learning machine in large-scale multi-label learning}, journal = {Journal of Machine Vision and Image Processing}, volume = {3}, number = {2}, pages = {39-57}, year = {2016}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {With a largeamount of multimedia content in the web, storage and retrieval of them by classical learning methods dealt with some major challenges like memory restriction. These limitations in some of learning algorithms like SVM and ANN is so serious that these algorithms cannot be employed in large-scale learning context. Kernel Extreme Learning Machine (KELM) algorithm is one of the powerful methods in machine learning. Learning phase of this method is based on constructing kernel matrix of labeled instances and calculating inverse of it. So, employing this method in large scale learning context with a lot of labeled instances is not feasible. In this research to overcome limitation of employing the KELM in large-scale multi-label learning, a new approach is proposed. The proposed approach is based on prototype selection in neighborhood of each training instance. By using the proposed approach, the size of training set is reduced. So, classical learning methods can be applied on reduced training set. Since multimedia contents are basically multi-label, the proposed prototype selection approach is based on multi-label domains like automatic image annotation. Experimental results on NUS-WIDE large-scale multi-label image set and three other versions include Object, Scene and Lite indicated the effectiveness of the proposed approach in solving the limitation of employing KELM method in large-scale multi-label learning.}, keywords = {Kernel Extreme Learning Machine (KELM),Prototype Selection,Large-Scale Multi-Label Learning,Automatic Image Annotation}, title_fa = {روشی مبتنی بر ماشین یادگیری سریع با هسته غیرخطی برای انتخاب نمونه‌های اولیه در یادگیری چندبرچسبه مقیاس بزرگ}, abstract_fa = {با وجود حجم عظیم محتوای چند رسانه‌ای در وب، ذخیره سازی و بازیابی آنها با بکارگیری روش‌های یادگیری موجود با محدودیت ‌هایی از جمله کمبود حافظه مواجه شده است. تاثیر گذاری محدودیت‌های مد نظر در روش‌های یادگیری دارای مرحله آموزش مانند ماشین بردار پشتیبان (SVM) و شبکه های عصبی تا جایی است که امکان بکارگیری این روش‌ها در کاربرد‌های مقیاس بزرگ تقریبا غیر‌ممکن است. روش ماشین یادگیری سریع مبتنی بر هسته غیر‌خطی (KELM) یکی از روش‌های قدرتمند ارائه شده در حوزه یادگیری ماشین است. اساس مرحله یادگیری در این روش مبتنی بر ساخت ماتریس هسته‌ی نمونه‌های برچسب‌دار و محاسبه معکوس آن می‌باشد. از اینرو، بکارگیری این روش در محیط‌های مقیاس بزرگ با وجود تعداد زیاد نمونه‌های برچسب دار امکان‌پذیر نیست. در این پژوهش به منظور حل مشکل مطرح شده در بکارگیری KELM در کاربردهای مقیاس بزرگ، روشی مبتنی بر انتخاب نمونه‌های اولیه با بهره‌گیری از KELM در مقیاس کوچک همسایگی هر نمونه آموزش ارائه شده است. با بکارگیری روش انتخاب نمونه‌های اولیه ارائه شده، حجم مجموعه آموزش کاهش می‌یابد. بنابراین امکان استفاده از روش یادگیری KELM در کاربردهای مقیاس بزرگ فراهم می‌شود. از آنجایی که کاربردهای حوزه چند رسانه ای وب به صورت چندبرچسبه می‌باشند، روش ارائه شده در انتخاب نمونه‌های اولیه، مبتنی بر کاربردهای چندبرچسبه مانند شرح‌گذاری خودکار تصاویر است. نتایج آزمایش‌های تجربی بر روی دادگان چندبرچسبه مقیاس بزرگ NUS-WIDE و نسخه‌های آن مانندObject، Scene و Lite بیانگر کارایی روش ارائه شده در حل محدودیت‌های بکارگیری KELM در کاربردهای چندبرچسبه مقیاس بزرگ با انتخاب نمونه‌های اولیه دارد.}, keywords_fa = {ماشین یادگیری سریع,انتخاب نمونه‌های اولیه,یادگیری چند‌برچسبه مقیاس بزرگ,شرح‌گذاری خودکار تصاویر}, url = {https://jmvip.sinaweb.net/article_23959.html}, eprint = {https://jmvip.sinaweb.net/article_23959_cd4051cb55dc710218836855dea67d45.pdf} } @article { author = {Karimi Rouzbahani, Hamid and Ebrahimpour, Reza and Bagheri, Nasour}, title = {Quantitative evaluation of human ventral visual stream in invariant object recognition: Human behavioral experiments and brain-plausible computational model simulations}, journal = {Journal of Machine Vision and Image Processing}, volume = {3}, number = {2}, pages = {59-72}, year = {2016}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {A computational approach is proposed which is aimed at quantitatively assessing human recognition abilities when objects undergo different variations in the image. During the recent decades, as a result of its high accuracy and speed, human visual system has been considered an idolfora variety ofcomputational object recognition algorithms in machine vision. Therefore, quantification of its behavior in different situations can lead tobetter modeling algorithms. In this study, human ability is evaluated in an object recognition task in which object images underwent different levels of variation in lighting conditions, pose, size and position. To do this, a variation-controlled object image dataset is generated and presented to humans as well as to a computational model of visual cortex. The computational model is used to measure the effect of each variation on object recognition. Human behavioral results show a decline in recognition performance when objects underwent pose variation. The performance suppression is shown to be the result of disability of untangling object representations in highlevels of pose variation.Quantitatively speaking, images which underwent variations in lighting, pose, size and position, experienced respectively 0.57, 0.33, 0.55 and 0.73 of representational enhancement travelling from pixel to visual cortex space.}, keywords = {Object Recognition,human visual cortex,convolutional neural network,invariant representation}, title_fa = {توانایی مسیر پیش‌رو قشر بینایی در مقابله با تغییرات در بازشناسی اشیاء: آزمایش‌های انسانی و مدل محاسباتی سازگار با قشر بینایی}, abstract_fa = {در این مقاله بازشناسی اشیاء در انسان در مواجهه با تغییرات مختلف بصورت کمّی مورد ارزیابی قرار می‌گیرد. در سالیان اخیر سامانه بینایی انسان به جهت سرعت و دقت بسیار بالا در بازشناسی اشیاء به عنوان الگویی برای توسعه بسیاری از الگوریتم‌های محاسباتی در حوزه بینایی ماشین بوده است. از این رو، شناخت هرچه بهتر این سامانه و کمّی‌سازی رفتار آن در شرایط مختلف می‌تواند تا حد زیادی به مدل‌سازی بهتر آن کمک نماید. در این پژوهش، توانایی بازشناسی انسان زمانی که اشیاء دچار تغییر زاویه تابش نور، جهت‌گیری عمقی، اندازه و موقعیت می‌شوند مورد ارزیابی قرار گرفته است. برای این منظور دسته‌ای از تصاویر با کنترل هر یک از تغییرات مذکور ساخته و تحت وضعیت‌های خاص به سوژه‌ها انسانی و  مدل محاسباتی قشر بینایی ارائه داده می‌شود. مدل محاسباتی به منظور کمّی‌سازی تاثیر هر یک از تغییرات بر روی بازشناسی استفاده می‌شود. نتایج آزمایش‌های انسانی حاکی از پیچیدگی بالای جهت‌گیری اشیاء در بازشناسی است. مشخص می‌شود که افت کارایی انسان بدلیل عدم توانایی در کاهش درهم‌تنیدگی بازنمایی‌های اشیاء در جهت‌گیری‌های شدید است. به صورت کمّی بازنمایی‌های حاصل از تغییر زاویه تابش نور، جهت‌گیری عمقی، اندازه و موقعیت با رفتن از فضای پیکسل به قشر بینایی به ترتیب 0/57، 0/33، 0/55 و 0/73 بهبود می‌یابند.}, keywords_fa = {بازشناسی اشیاء,قشر بینایی انسان,شبکه عصبی کانولوشنی,بازنمایی مستقل از تغییرات}, url = {https://jmvip.sinaweb.net/article_32800.html}, eprint = {https://jmvip.sinaweb.net/article_32800_6d0aa83162c0fc8f112f6bba24bc245d.pdf} } @article { author = {Shakoor, Mohammad Hossein and Tajeripour, Farshad}, title = {Local Entropy Pattern for Feature Extraction of Texture Images}, journal = {Journal of Machine Vision and Image Processing}, volume = {3}, number = {2}, pages = {73-85}, year = {2016}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {There are many methods for feature extraction from texture images. Local Binary Pattern (LBP) is one of the most important of these methods. It is a simple method for implementation and can extracttexture features efficiently.LBP can be combined with local variance (VAR) to provide higher classification rate. In this paper, a new method is proposedwhich is named Local Entropy Pattern (LEP). The equation of this method is similar to Entropy literally, butit is differ from Entropy in some issues. The proposed method is more robust to noise than LBP and VAR. In addition, by combiningit's features with LBP features the classification rate increases significantly and it provides higher accuracy than LBP/VAR. Local Entropy Pattern shows dissimilarity of a local neighborhood. This approach has all positive points of LBP and some state-of-art similar methods. It is not only rotation and grayscale invariant but also noise robust.}, keywords = {Texture Classification,Feature Extraction,Local Binary Patterns,Local Variance,Local Entropy Pattern}, title_fa = {الگوی انتروپی محلی جهت استخراج ویژگی های تصاویر بافتی}, abstract_fa = {روشهای زیادی برای استخراج ویژگی از تصاویر بافتی ارائه شده اند، یکی از مهمترین و ساده ترین روش ها، روش های مبتنی بر الگوی دودویی محلی است که بدلیل سادگی در پیاده سازی و استخراج ویژگی های مناسب با دقت طبقه بندی بالا، مورد توجه بسیاری از متخصصان قرار گرفته است. همچنین از ترکیب الگوی دودویی محلی و واریانس محلی ویژگی هایی با نتایج بهتر طبقه بندی تولید شده است. در اینجا از یک روش جدید بنام الگوی انتروپی محلی استفاده شده است. این روش از آن جهت که از رابطه ای مشابه انتروپی استفاده می کند بر این اساس نامگذاری شده است ولی از برخی جهات با رابطه انتروپی فرق دارد. روش پیشنهادی در مقایسه با الگوی دودویی محلی و واریانس محلی به نویز مقاوم تر است. همچنین ترکیب آن با الگوی دودویی محلی نتایج بسیار بهتری نسبت به ترکیب واریانس محلی با الگوی دودویی محلی تولید می کند. الگوی انتروپی محلی همانند واریانس نشان دهنده میزان غیرهمسان بودن الگوهای محلی هر همسایگی است. این روش ضمن اینکه کلیه ویژگی های مثبت روش های موجود مانند غیرحساس بودن به چرخش و تغییرات روشنایی را دارد، نسبت به نویز نیز بسیار مقاوم است.}, keywords_fa = {طبقه بندی بافت,استخراج ویژگی,الگوهای دودویی محلی,واریانس محلی,الگوی انتروپی محلی}, url = {https://jmvip.sinaweb.net/article_33505.html}, eprint = {https://jmvip.sinaweb.net/article_33505_0f1e0816f83c6376a2527cd11abdbc04.pdf} }