انجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11973220161121Hand gesture recognition for human computer interaction using motion trajectory coding and artificial neural networkتشخیص حرکات دست برای تعامل انسان و رایانه با استفاده از کدگذاری خط سیر حرکت و شبکه عصبی مصنوعی132216712FAفرزانه آزادی پور قهستانیدانشکده برق وکامپیوتر، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته کرمانعصمت راشدیدانشکده برق وکامپیوتر، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته کرمانJournal Article20160210Human hand movements are used in the non-verbal interaction between human and computers. Intuitive and natural hand movements is the most important factor motivating researchers to use the hands to improve the human-computerinteraction. In this paper, for hand gesture recognition, hand as the only moving object in the video is detectedusing the difference between frames. After that, hand movement feature vector is extracted. This vector is used to detect hand gesture using artificial neural network. Two methods are proposed for feature-vector extraction. The first method codes themotion trajectory of the final hand pixel in the frames. The second method uses two angle histograms. Identifying six different gestures with recognition rate of 95.54 percent using the first method and 91.53 percent using the second method, shows the efficiency of the proposed system. Also, the comparison between the proposed feature vectors with a conventional method shows the superiority of theproposed methods in terms of accuracy, the number of features, and classifier training time.حرکات دست انسان حالتی از تعامل غیرکلامی است که در ارتباط بین انسان و رایانه مورد استفاده قرار میگیرد. شهودی و طبیعی بودن حرکات دست مهمترین عامل ایجاد انگیزه در محققان است که دستها را برای بهبود تعامل بین انسان و رایانه مورد استفاده قرار دهند. در این مقاله جهت تشخیص حرکت دست، با استفاده از اختلاف فریم ها، دست به عنوان تنها شی متحرک در تصاویر جدا شده است. پس از آن، بردار ویژگی حرکت دست استخراج شده است. این بردار ویژگی به عنوان ورودی شبکه عصبی مصنوعی جهت طبقه بندی حرکات انتقالی دست استفاده شده است. برای استخراج بردار ویژگی دو روش ارائه شده است. بردار ویژگی اول حاصل از کدگذاری خط سیر انتهایی ترین پیکسل دست در طی فریم ها است. بردار ویژگی دوم، از دو هیستوگرام زاویه ای برای کدگذاری دست استفاده میکند. شناسایی شش حرکت مختلف دست در داده های آزمایشی با نرخ بازشناسی 95/54 درصد با استفاده از بردار ویژگی اول و تشخیص این حرکات با نرخ بازشناسی 95/53 توسط بردار ویژگی دوم، کارایی بردارهای ویژگی پیشنهادی در تشخیص حرکات دست را نشان می دهد. همچنین مقایسه ی بردارهای ویژگی پیشنهادی با بردار ویژگی یک روش متداول، برتری روش های پیشنهادی را از نظر دقت، تعداد ویژگیها و زمان آموزش طبقه بند نشان می دهد.انجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11973220161121Multi Image Super Resolution in Presence of Noise by Determining Weighting Coefficients in Map Estimatorافزایش تفکیکپذیری چند تصویری در حضور نویز با تعیین تطبیقی وزن جملهها در تخمینگر MAP233817547FAنفیسه مفیدیدانشکده مهندسی برق و رباتیک، دانشگاه صنعتیشاهرودعلیرضا احمدی فرددانشکده مهندسی برق و رباتیک، دانشگاه صنعتیشاهرودJournal Article20160116In order to enhance image resolution and overcome the physical limitations of imaging systems, image super-resolution (SR) is proposed. In SR technique, a high resolution (HR) image is produced by fusing a sequence of low-resolution (LR) images.Since many recent approaches seeking an SR algorithm suppresses noise whilepreserving edges, in this paper, based-upon the statistical techniques, we have proposed an adaptive algorithmwhich is robust in the presenceof Gaussian noise -which has a high detrimental effect on image quality- and moreover, shows a good performance comparing to the other existing methods.In this adaptive algorithm we introducea set of weighting coefficients, which control the contribution between the dataerror and regularization terms in each of the estimated HR pixels. These coefficients are determined according to the neighbors information of the estimated pixel. Experimental results from both synthetic and real images confirm that theproposed algorithm outperforms the other methods.به منظور ارتقاء توان تفکیکپذیری تصویر و غلبه بر محدودیتهای فیزیکی سیستمهای تصویربرداری روش فراتفکیکپذیری تصویر مطرح میگردد. در این روش یک تصویر با تفکیکپذیری بالا از صحنه به کمک تلفیق رشتهای از تصاویر با تفکیکپذیری پایین صحنه، بازسازی میگردد. از آنجاییکه رویکرد بسیاری از روشهای فراتفکیکپذیری که اخیراً مورد استفاده قرار میگیرند بازسازی تصویر حذف نویز شده با تاکید بر حفظ لبه و جزئیات است، در این مقاله بر مبنای الگوریتمهای آماری، روشی تطبیقی پیشنهاد شده است که نسبت به نویز گوسی که موثرترین نویز تخریبکننده کیفیت تصویر است مقاوم بوده و دارای عملکرد مطلوبی نسبت به سایر روشهای مطرح شده است. در این روش تطبیقی، با معرفی ضرایبی جدید، اثرات نسبی جمله خطای داده و جمله تنظیم را در هر پیکسل تصویر تخمین زده شده ی با تفکیکپذیری بالا، کنترل مینماییم. این ضرایب با توجه به اطلاعات همسایگان پیکسل موردنظر تعیین می گردد. آزمایشهای انجام شده بر روی تصاویر ساخته شده و تصاویر واقعی نیز، عملکرد خوب الگوریتم پیشنهادی را نسبت به سایر روشها تصدیق میکند.انجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11973220161121A prototype selection method based on kernel extreme learning machine in large-scale multi-label learningروشی مبتنی بر ماشین یادگیری سریع با هسته غیرخطی برای انتخاب نمونههای اولیه در یادگیری چندبرچسبه مقیاس بزرگ395723959FAحمید کارگرشورکیدانشجوی کارشناسی ارشد دانشکده مهندسی برق و کامپیوتر، دانشگاه یزدمحمدعلی زارع چاهوکیدانشکده مهندسی برق و کامپیوتر، دانشگاه یزدJournal Article20151008With a largeamount of multimedia content in the web, storage and retrieval of them by classical learning methods dealt with some major challenges like memory restriction. These limitations in some of learning algorithms like SVM and ANN is so serious that these algorithms cannot be employed in large-scale learning context. Kernel Extreme Learning Machine (KELM) algorithm is one of the powerful methods in machine learning. Learning phase of this method is based on constructing kernel matrix of labeled instances and calculating inverse of it. So, employing this method in large scale learning context with a lot of labeled instances is not feasible. In this research to overcome limitation of employing the KELM in large-scale multi-label learning, a new approach is proposed. The proposed approach is based on prototype selection in neighborhood of each training instance. By using the proposed approach, the size of training set is reduced. So, classical learning methods can be applied on reduced training set. Since multimedia contents are basically multi-label, the proposed prototype selection approach is based on multi-label domains like automatic image annotation. Experimental results on NUS-WIDE large-scale multi-label image set and three other versions include Object, Scene and Lite indicated the effectiveness of the proposed approach in solving the limitation of employing KELM method in large-scale multi-label learning.با وجود حجم عظیم محتوای چند رسانهای در وب، ذخیره سازی و بازیابی آنها با بکارگیری روشهای یادگیری موجود با محدودیت هایی از جمله کمبود حافظه مواجه شده است. تاثیر گذاری محدودیتهای مد نظر در روشهای یادگیری دارای مرحله آموزش مانند ماشین بردار پشتیبان (SVM) و شبکه های عصبی تا جایی است که امکان بکارگیری این روشها در کاربردهای مقیاس بزرگ تقریبا غیرممکن است. روش ماشین یادگیری سریع مبتنی بر هسته غیرخطی (KELM) یکی از روشهای قدرتمند ارائه شده در حوزه یادگیری ماشین است. اساس مرحله یادگیری در این روش مبتنی بر ساخت ماتریس هستهی نمونههای برچسبدار و محاسبه معکوس آن میباشد. از اینرو، بکارگیری این روش در محیطهای مقیاس بزرگ با وجود تعداد زیاد نمونههای برچسب دار امکانپذیر نیست. در این پژوهش به منظور حل مشکل مطرح شده در بکارگیری KELM در کاربردهای مقیاس بزرگ، روشی مبتنی بر انتخاب نمونههای اولیه با بهرهگیری از KELM در مقیاس کوچک همسایگی هر نمونه آموزش ارائه شده است. با بکارگیری روش انتخاب نمونههای اولیه ارائه شده، حجم مجموعه آموزش کاهش مییابد. بنابراین امکان استفاده از روش یادگیری KELM در کاربردهای مقیاس بزرگ فراهم میشود. از آنجایی که کاربردهای حوزه چند رسانه ای وب به صورت چندبرچسبه میباشند، روش ارائه شده در انتخاب نمونههای اولیه، مبتنی بر کاربردهای چندبرچسبه مانند شرحگذاری خودکار تصاویر است. نتایج آزمایشهای تجربی بر روی دادگان چندبرچسبه مقیاس بزرگ NUS-WIDE و نسخههای آن مانندObject، Scene و Lite بیانگر کارایی روش ارائه شده در حل محدودیتهای بکارگیری KELM در کاربردهای چندبرچسبه مقیاس بزرگ با انتخاب نمونههای اولیه دارد.انجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11973220161121Quantitative evaluation of human ventral visual stream in invariant object recognition: Human behavioral experiments and brain-plausible computational model simulationsتوانایی مسیر پیشرو قشر بینایی در مقابله با تغییرات در بازشناسی اشیاء: آزمایشهای انسانی و مدل محاسباتی سازگار با قشر بینایی597232800FAحمید کریمی روزبهانیدانشکده مهندسی برق، دانشگاه تربیت دبیر شهید رجاییرضا ابراهیم پوردانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایینصور باقریدانشکده مهندسی برق، دانشگاه تربیت دبیر شهید رجاییJournal Article20160103A computational approach is proposed which is aimed at quantitatively assessing human recognition abilities when objects undergo different variations in the image. During the recent decades, as a result of its high accuracy and speed, human visual system has been considered an idolfora variety ofcomputational object recognition algorithms in machine vision. Therefore, quantification of its behavior in different situations can lead tobetter modeling algorithms. In this study, human ability is evaluated in an object recognition task in which object images underwent different levels of variation in lighting conditions, pose, size and position. To do this, a variation-controlled object image dataset is generated and presented to humans as well as to a computational model of visual cortex. The computational model is used to measure the effect of each variation on object recognition. Human behavioral results show a decline in recognition performance when objects underwent pose variation. The performance suppression is shown to be the result of disability of untangling object representations in highlevels of pose variation.Quantitatively speaking, images which underwent variations in lighting, pose, size and position, experienced respectively 0.57, 0.33, 0.55 and 0.73 of representational enhancement travelling from pixel to visual cortex space.در این مقاله بازشناسی اشیاء در انسان در مواجهه با تغییرات مختلف بصورت کمّی مورد ارزیابی قرار میگیرد. در سالیان اخیر سامانه بینایی انسان به جهت سرعت و دقت بسیار بالا در بازشناسی اشیاء به عنوان الگویی برای توسعه بسیاری از الگوریتمهای محاسباتی در حوزه بینایی ماشین بوده است. از این رو، شناخت هرچه بهتر این سامانه و کمّیسازی رفتار آن در شرایط مختلف میتواند تا حد زیادی به مدلسازی بهتر آن کمک نماید. در این پژوهش، توانایی بازشناسی انسان زمانی که اشیاء دچار تغییر زاویه تابش نور، جهتگیری عمقی، اندازه و موقعیت میشوند مورد ارزیابی قرار گرفته است. برای این منظور دستهای از تصاویر با کنترل هر یک از تغییرات مذکور ساخته و تحت وضعیتهای خاص به سوژهها انسانی و مدل محاسباتی قشر بینایی ارائه داده میشود. مدل محاسباتی به منظور کمّیسازی تاثیر هر یک از تغییرات بر روی بازشناسی استفاده میشود. نتایج آزمایشهای انسانی حاکی از پیچیدگی بالای جهتگیری اشیاء در بازشناسی است. مشخص میشود که افت کارایی انسان بدلیل عدم توانایی در کاهش درهمتنیدگی بازنماییهای اشیاء در جهتگیریهای شدید است. به صورت کمّی بازنماییهای حاصل از تغییر زاویه تابش نور، جهتگیری عمقی، اندازه و موقعیت با رفتن از فضای پیکسل به قشر بینایی به ترتیب 0/57، 0/33، 0/55 و 0/73 بهبود مییابند.انجمن بینایی ماشین و پردازش تصویر ایرانمجله بینایی ماشین و پردازش تصویر2383-11973220161121Local Entropy Pattern for Feature Extraction of Texture Imagesالگوی انتروپی محلی جهت استخراج ویژگی های تصاویر بافتی738533505FAمحمد حسین شکورگروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامیفرشاد تاجری پوردانشکده مهندسی برق و کامپیوتر، دانشگاه شیرازJournal Article20160108There are many methods for feature extraction from texture images. Local Binary Pattern (LBP) is one of the most important of these methods. It is a simple method for implementation and can extracttexture features efficiently.LBP can be combined with local variance (VAR) to provide higher classification rate. In this paper, a new method is proposedwhich is named Local Entropy Pattern (LEP). The equation of this method is similar to Entropy literally, butit is differ from Entropy in some issues. The proposed method is more robust to noise than LBP and VAR. In addition, by combiningit's features with LBP features the classification rate increases significantly and it provides higher accuracy than LBP/VAR. Local Entropy Pattern shows dissimilarity of a local neighborhood. This approach has all positive points of LBP and some state-of-art similar methods. It is not only rotation and grayscale invariant but also noise robust.روشهای زیادی برای استخراج ویژگی از تصاویر بافتی ارائه شده اند، یکی از مهمترین و ساده ترین روش ها، روش های مبتنی بر الگوی دودویی محلی است که بدلیل سادگی در پیاده سازی و استخراج ویژگی های مناسب با دقت طبقه بندی بالا، مورد توجه بسیاری از متخصصان قرار گرفته است. همچنین از ترکیب الگوی دودویی محلی و واریانس محلی ویژگی هایی با نتایج بهتر طبقه بندی تولید شده است. در اینجا از یک روش جدید بنام الگوی انتروپی محلی استفاده شده است. این روش از آن جهت که از رابطه ای مشابه انتروپی استفاده می کند بر این اساس نامگذاری شده است ولی از برخی جهات با رابطه انتروپی فرق دارد. روش پیشنهادی در مقایسه با الگوی دودویی محلی و واریانس محلی به نویز مقاوم تر است. همچنین ترکیب آن با الگوی دودویی محلی نتایج بسیار بهتری نسبت به ترکیب واریانس محلی با الگوی دودویی محلی تولید می کند. الگوی انتروپی محلی همانند واریانس نشان دهنده میزان غیرهمسان بودن الگوهای محلی هر همسایگی است. این روش ضمن اینکه کلیه ویژگی های مثبت روش های موجود مانند غیرحساس بودن به چرخش و تغییرات روشنایی را دارد، نسبت به نویز نیز بسیار مقاوم است.