@article { author = {Ramazanzadeh, Reza and Mehrshad, Naser}, title = {Multi Scale and Multi Directional Edge Detection by using the Primary Vision Model and Contractive Fusion of Image Gradients}, journal = {Journal of Machine Vision and Image Processing}, volume = {1}, number = {2}, pages = {1-13}, year = {2014}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {Edge detection is one of the most important and basic problems in image processing and image analysis and machine vision. The importance of this issue is that the output of many image analysis algorithms are dependent on accurately and correctly edge detection algorithm. However a comprehensive and perfect solution that be able to do edge detection with considering all of the edge patterns and factors affecting it, so far not provided. In this paper, firstly, inspired by computational model of retina and primary visual cortex cells in the brain, we propose an appropriate Gabor function as a gradient operation different directions and scales with adaptive parameters. Then, for fusion of rectified gradient responses, we introduce an algorithm based on edge segments contraction from large-scales toward small-scales. This research is trying to satisfy three criteria introduced by Canny properly. With the implementation of multi-scale and multi-directional analysis and contractive fusion of image gradients, better detection and more precise positioning of edges has been obtained. The experimental results indicate that the effective ness of this method on natural and artificial images is better than the conventional methods (e.g. Canny).}, keywords = {Edge detection,Multi-scale and multi-directional analysis,Gabor filter,Contractive fusion}, title_fa = {آشکارسازی لبه به صورت چند جهته و چند مقیاسی با استفاده از مدل بینایی اولیه و ادغام منقبض شوندۀ پاسخ های گرادیان}, abstract_fa = {مسئله آشکارسازی لبه به عنوان یکی از اساسی‌ترین و مهم‌ترین مسائل در پردازش و تحلیل تصویر مطرح بوده است، اهمیّت این مسئله ناشی از آن است‌ که خروجی خیلی از الگوریتم‌های تحلیل تصویر، به الگوریتم تشخیص لبۀ صحیح و دقیق وابسته است. امّا یک روش جامع و کامل که بتواند کار تشخیص لبه در تصویر را با درنظر گرفتن همۀ الگوهای لبه و عوامل مؤثر در تشخیص لبه انجام دهد، تاکنون ارائه نشده است. در این تحقیق، در ابتدا با الهام از مدل محاسباتی سلول‌های شبکیۀ چشم و سلول سادۀ غشاء اولیۀ بینایی در مغز، عملگر گرادیان مناسب به صورت توابع گابور در جهت‌ها و مقیاس‌های مختلف و با پارامتر‌های تطبیقی مناسب، پیشنهاد می‌شود. سپس برای ادغام پاسخ‌های گرادیان یکسوشده، الگوریتمی بر‌اساس انقباض قطعات لبه از مقیاس‌‌های بزرگتر به سوی مقیاس‌های کوچکتر ارائه می‌شود. این پژوهش سعی دارد سه معیار‌‌ معرفی شده توسط کنی را به طور مطلوب برآورده سازد. با اجرای تحلیل چند جهته و چند مقیاسی و ادغام منقبض شوندۀ پاسخ‌های گرادیان، آشکارسازی بهتر و مکان‌یابی دقیق‌تر لبه حاصل شده است. نتایج استفاده از این روش در تصاویر طبیعی و ساختگی بیانگر کارآیی بهتر این روش نسبت به روش‌های مرسوم (مانند روش کنی) است.    }, keywords_fa = {آشکارسازی لبه,تحلیل چند جهته و چند مقیاسی,فیلتر گابور,ادغام منقبض شونده}, url = {https://jmvip.sinaweb.net/article_4399.html}, eprint = {https://jmvip.sinaweb.net/article_4399_db7a891a93c54a3851ba5395d073537a.pdf} } @article { author = {Norouzzadeh, Yaser and Nezamabadi-pour, Hossein}, title = {New Visual Features for Farsi Handwriting Images based Graphology Study of Personality using Image Processing for Farsi Handwriting}, journal = {Journal of Machine Vision and Image Processing}, volume = {1}, number = {2}, pages = {15-26}, year = {2014}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {In this paper, new visual features for personality identification based on Farsi handwriting images are proposed.  The purpose of this study is to establish a computer aided system to automatically extract some attributes that are used by graphologists for the analysis of handwriting. Therefore, these attributes should be presented in the forms that be extractable from the handwriting images. To do this, first the handwriting images are preprocessed and the features such as pen width, spaces between lines, heights of sub-words, etc. are extracted. In the next step, some features including spaces between words, the size of letters and sub-words, the deviation of letters and the height of vertical letters are calculated. These features are employed to recognize the type of handwriting. Eventually, the extracted features from handwriting images are examined on a set of images which have been commented on by graphologist. The experimental results confirm the effectiveness of the proposed features.}, keywords = {Graphology,Handwriting analysis,Farsi handwriting,image processing}, title_fa = {ارائه ویژگیهای دیداری جدید در تصویر دستنوشته فارسی برای تشخیص روحیات افراد}, abstract_fa = {در این مقاله، ویژگیهای دیداری جدیدی برای تشخیص روحیات افراد بر اساس دست نوشته فارسی پیشنهاد شده است. هدف این پژوهش این است که مشخصاتی که گرافولوژیستها در مورد مشخصات دست نوشته بیان می کنند را بتوان با کمک کامپیوتر براساس تصویر دست نوشته به طور خودکار استخراج کرد. بنابراین باید این مشخصات به صورت ویژگیهای دیداری قابل استخراج از تصویر بیان شوند. برای این منظور ابتدا تصاویر دست نوشته ها پیش پردازش می شوند و ویژگیهایی مانند عرض قلم، فاصله خطوط، ارتفاع حروف و ... استخراج می شوند. در مرحله بعد ویژگیهایی از قبیل فواصلبینکلمات، اندازه حروف، میزان کجی حروف و ارتفاع حروف عمودی محاسبه شده اند. این ویژگیها برای تشخیص نوع دست نوشته از لحاظ نظم و عدم تساوی حروف به کار می روند. ویژگیهای ارائه شده روی دست نوشته های دسته بندی شده توسط گرافولوژیست آزموده شده است. نتایج، مناسب بودن ویژگیهای پیشنهاد شده را تأیید می کند.     }, keywords_fa = {گرافولوژی,استخراج ویژگی,پردازش تصویر,دست نوشته فارسی}, url = {https://jmvip.sinaweb.net/article_4397.html}, eprint = {https://jmvip.sinaweb.net/article_4397_838f94f87c9ac9f91624b02c24c016fa.pdf} } @article { author = {Mehrdad, Vahid and Ebrahimnezhad, Hossein}, title = {Retrieving of 3D Models using Linear Prediction Coefficients in Cylindrical Projections by Generalizing the Projection to three Perpendicular Cylinders}, journal = {Journal of Machine Vision and Image Processing}, volume = {1}, number = {2}, pages = {27-38}, year = {2014}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {In the recent years, due to the growth and development of the Internet, 3D model retrieval has become a wide research field. Several methods have been presented to retrieve 3D models. Each method employs a special feature. In this paper, a geometric based method is proposed to retrieve the objects. In 3D models, the adjacent points on the surface of object are highly correlated. So, the linear prediction analysis has a proper performance to estimate these models. In this paper, the linear prediction coefficients are extracted from cylindrical projections of 3D objects as an appropriate descriptor. At first, the object is projected onto the lateral surface of a bounding cylinder. Then, the linear prediction coefficients are extracted from cylindrical projection. To alleviate the occlusion problem, cylindrical projection is generalized to three cylinders along all principal axes. The principal component analysis is employed to normalize the descriptor against rotation. The performance of the proposed descriptor is evaluated employing the McGill database of 3D models. Experimental results demonstrate that the proposed method discriminates the objects with different structure and remains robust against noise as well.}, keywords = {3D Model retrieval,Cylindrical projection,Linear prediction Coefficients,Pose normalization}, title_fa = {بازیابی مدلهای سه بعدی با استفاده از ضرایب پیشگویی خطی در نگاشت های استوانه ای با تعمیم نگاشت بر روی سه استوانه متعامد}, abstract_fa = {در سال‌های اخیر به علت رشد و توسعه‌ی اینترنت، بازیابی مدل‌های سه‌بعدی به یک زمینه‌ی تحقیقاتی وسیع در دنیا تبدیل شده است. تاکنون روش‌های زیادی برای بازیابی این مدل‌ها ارائه گردیده و هر کدام ویژگی خاصی را برای عمل بازیابی مورد استفاده قرار می‌دهد. در این مقاله یک روش مبتنی بر هندسه برای بازیابی مد‌ل‌های سه‌بعدی پیشنهاد می‌شود. در مدل‌های سه‌بعدی، نقاط واقع بر رویه‌ی مدل دارای همبستگی بالایی با نقاط مجاور هستند. بنابراین تحلیل پیشگویی خطی برای تخمین این مدل‌ها عملکرد مناسبی دارد. در این مقاله، ضرایب پیشگویی خطی بعنوان یک توصیفگر قوی از نگاشت استوانه‌ای مدل سه‌بعدی استخراج می‌شود. برای این منظور، ابتدا مدل سه‌بعدی بر روی سطح جانبی استوانه‌ی محاط بر مدل نگاشت می‌شود. سپس ضرایب پیشگویی خطی از نگاشت استوانه‌ای مدل استخراج می‌گردد. در ادامه با نگاشت بر سه استوانه‌ی ‌هم‌راستا با محورهای اصلی بجای یک استوانه، اطلاعات گم‌شده‌ی مدل در اثر قرار گرفتن در مانع کاهش یافته و کارایی مدل بهبود می‌یابد. روش ارائه ‌شده در مقابل چرخش، انتقال، مقیاس‌بندی و نویز نیز مقاوم است. برای پایداری توصیفگر در مقابل چرخش از آنالیز مولفه‌ی اصلی استفاده شده است. کارایی توصیفگر پیشنهاد شده با استفاده از پایگاه داده‌ی سه‌بعدی McGill مورد ارزیابی قرار می‌گیرد. نتایج شبیه سازی نشان می‌دهد که روش پیشنهادی، مدل‌های سه‌بعدی با ساختارهای مختلف را بخوبی از همدیگر تفکیک می‌نماید و همچنین در برابر نویز نیز بسیار مقاوم است.  }, keywords_fa = {بازیابی مدلهای سه بعدی,نگاشت استوانه ای,ضرایب پیشگویی خطی,نرمالیزاسیون حالت}, url = {https://jmvip.sinaweb.net/article_4400.html}, eprint = {https://jmvip.sinaweb.net/article_4400_2fa824865ed38844a7bb96b723958766.pdf} } @article { author = {Sigari, Mohamad-Hoseyn and Soltanian-Zadeh, Hamid and Pourreza, Hamid-Reza}, title = {Systems for Video Content and Semantic Analysis: A Review from Viewpoint of Semantic Hierarchy for Video Production}, journal = {Journal of Machine Vision and Image Processing}, volume = {1}, number = {2}, pages = {39-55}, year = {2014}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {A semantic video analysis system is a semi- or fully-automated system for investigation of video contents and extraction of concepts and semantics from video. These systems can be classified from different viewpoints. In this article, the semantic gap between low-level features and high-level concepts in the semantic video analysis systems is discussed and the literature is reviewed from viewpoint of semantic hierarchy for video production.To this end, after a brief description of video analysis systems and their general block diagram, two main challenges of these systems are discussed: sensory gap and semantic gap. Then, different approaches for reduction of the semantic gap are studied based on a semantic hierarchy used for video production. According to this hierarchical structure, there are three main steps for reduction of semantic gaps: frame processing; content analysis; and semantic extraction. Finally, open problems in this field of research are presented as the following. Usually, a wide variety of events and concepts may occur in a video. Different concepts may be assigned to an event in different circumstances. Some high-level concepts may occur in a relatively long duration of video; thus, extraction of such concepts requires processing of a relatively long duration of video to construct a semantic network between the concepts extracted from short durations of video. Usually, analysis of multi-modal information may close the semantic gaps that exist in the analysis of single-modal information.}, keywords = {Concept extraction,Event detection,Hierarchical semantic Structure,Semantic gap,Semantic video analysis}, title_fa = {مروری بر سیستم‌های تحلیل محتوایی و معنایی ویدیو از دیدگاه ساختار سلسله مراتب معنایی در تولید فیلم}, abstract_fa = {سیستم‌های تحلیل معنایی ویدیو به دسته‌ای از سیستم‌ها اطلاق می‌شود که نوعی ابزار هوشمند جهت بررسی و تحلیل محتوایی و معنایی ویدیو می‌باشند. بررسی و دسته‌بندی این سیستم‌ها می‌تواند از دیدگاه‌های مختلف انجام شود. در این مقاله سعیشدهبر اساس یک ساختار سلسله مراتبی که از نحوه تولید فیلم توسط یک فیلم‌ساز برگرفته شده است، سیستم‌های تحلیل معنایی ویدیواز نظر شکاف معنایی میان ویژگی‌های سطح پایین و مفاهیم سطح بالا مورد بررسی قرار گیرند. به این ترتیب، پس از معرفی سیستم‌های تحلیل معنایی ویدیو، دو چالش اصلی در این سیستم‌ها مطرح می‌شود: شکاف حسگری و شکاف معنایی. پس از آن با ارائه یکساختار سلسله مراتبی مبتنی بر نحوه ساخت فیلم، چگونگی کاهش شکاف معنایی در سیستم‌های تحلیل ویدیو مورد بررسی قرار گرفته و تحقیقات انجام شده در این زمینه مرور می‌شود. بر اساس این ساختار، سیستم‌های تحلیل ویدیو در سه سطح دسته‌بندی و مرور می‌شوند: پردازش فریم‌ها، استخراج محتوا و استخراج معنا. در نهایت مشکلات و مسائل باز در سیستم‌های کنونی تحلیل معنایی ویدیو بازگو می‌گردد. مهمترین مشکلات در این زمینه عبارتند از: تنوع رویدادها و مفاهیم در یک ویدیو، ‌امکان وجود معانی و مفاهیم متعدد براییک رویداد معین، پردازش‌های بلندمدت برای استخراج معانی و مفاهیم و استفاده و ترکیب داده‌های چندنوعی. به این ترتیب، با مروری بر مقالات، مسیرهای تحقیقاتی فعلی و مشکلات پیشرو در زمینه سیستم‌های تحلیل معنایی ویدیو معرفی خواهد شد. }, keywords_fa = {آشکارسازی رویداد,استخراج مفهوم,تحلیل معنایی ویدیو,شکاف معنایی}, url = {https://jmvip.sinaweb.net/article_4398.html}, eprint = {https://jmvip.sinaweb.net/article_4398_e1d394d2881be8c0fce863cffc2767b5.pdf} } @article { author = {Mousavian, Zhila and Ebrahimnezhad, Hossein}, title = {New Visual Features for Farsi Handwriting Images based Graphology Study of Personality using Image Processing for Farsi Handwriting}, journal = {Journal of Machine Vision and Image Processing}, volume = {1}, number = {2}, pages = {57-66}, year = {2014}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {In this paper, we propose a system for recognizing static signs of Persian sign language (PSL). This system, designed based on a novel geometric feature, can automatically recognize static signs of Persian sign language alphabet with high accuracy. In feature extraction stage, we first find the center of gravity and contour of the hand shape in images, and then sample from obtained hand contour points. Then we consider a circle for each point on the contour. For this purpose, we compute the distance between the center of gravity of hand shape and each point along the contour. We select half of the computed distance for each point and the point located in the middle of this distance as radius and center of circle respectively. The resulting circles contain valuable information about the shape of hand that they are organized as feature vector for each sign. To recognize signs with high reliability, we propose a system that combine support vector machine (SVM) with K nearest neighbor (KNN). Experiments are performed on PSL database. The accuracy and reliability of proposed system with the test data are 93.33% and 98.73% respectively. The obtained results show the performance of proposed system is satisfactory.}, keywords = {recognition,Sign language,Feature Extraction,Hand,Contour,Sampling}, title_fa = {بازشناسی علامت‌های ساکن زبان اشاره‌ی فارسی با استفاده از یک توصیف‌گر شکلی جدید}, abstract_fa = {در این مقاله یک سیستم برای بازشناسی علامت‌های ساکن زبان اشاره‌ی فارسی پیشنهاد شده است. این سیستم بر مبنای یک ویژگی شکلی جدید طراحی شده و قادر است با نرخ تشخیص بالایی، علامت‌های ساکن الفبای زبان اشاره‌ی فارسی را به طور خودکار بازشناسی کند. در اینسیستم، ابتدا با استفاده از آنالیز مؤلفه‌ی اصلی (PCA)، جهت‌های غالب دست را بدست می‌آوریم و تصاویر را در جهت غالب دست، به نحوی که سیستم مختصات جدید تصویر بر راستای جهت‌های غالب دست منطبق شود، می‌چرخانیم. سپس یک ویژگی در ارتباط با انواع شکل دست در این مقاله پیشنهاد می‌شود و این ویژگی بر روی تصاویر تنظیم شده اعمال می‌شود. در مرحله‌ی استخراج ویژگی،ابتدا مرکز ثقل شکل دست و منحنی پیرامونی آن را در هر تصویر بدستمی‌آوریم و از منحنی پیرامونی بدست آمده در هر علامت،نمونه‌برداری می‌کنیم. سپس برای بدست آوردن اطلاعات شکلی مناسب از حالت دست،دوایری به مرکز نقطه وسط بین مرکز ثقل شکل دست و نقاط نمونه‌برداری شده و به شعاع نصف فاصله‌ی بین نقاط ذکر شده برازش می‌دهیم. از این دوایر،اطلاعاتی از شکل دست به عنوان بردار ویژگی برای هر علامتتهیه می‌شود. برای بازشناسی علامت‌ها با قابلیت اطمینان بالا، یک سیستم ترکیبی از دو کلاس بند ماشین‌ بردار پشتیبان (SVM) و K نزدیکترین همسایه  (KNN) را پیشنهاد می کنیم. نرخ بازشناسی و قابلیت اطمینان سیستم پیشنهادی بر روی مجموعه‌ی آزمایشی پایگاه داده PSLبه ترتیب 33/93% و 73/98% می‌باشد که مؤید این مطلب است که عملکرد سیستم پیشنهادیتا حدود زیادی رضایت بخش و مطلوب می‌باشد. }, keywords_fa = {آنالیز مؤلفه‌ی اصلی,بازشناسی,زبان اشاره‌,ماشین‌ بردار پشتیبان,نزدیکترین همسایه,نمونه‌برداری}, url = {https://jmvip.sinaweb.net/article_4531.html}, eprint = {https://jmvip.sinaweb.net/article_4531_23c68d78b071d24f27c4c6e33348c59b.pdf} } @article { author = {Rezaee, Khosro and Haddadnia, Javad and Delbari, Ahmad}, title = {Elderly Fall Monitoring System Based on Gaussian Mixture Models and Anatomical Changes in Video Sequences}, journal = {Journal of Machine Vision and Image Processing}, volume = {1}, number = {2}, pages = {67-77}, year = {2014}, publisher = {Iranian Society of Machine Vision and Image Processing}, issn = {2383-1197}, eissn = {2383-1197}, doi = {}, abstract = {Studies show that 25% to 47% of elderly will at least once experience falls and this figure is approximately 50% among the elderly living in nursing home. In this paper, based on the Gaussian Mixture Model (GMM) and estimating their parameters by Expectation Maximization (EM) algorithm, a new method has been proposed that firstly, the binary movement of the elderly is segmented from video sequences. Next, the occurrence of falls in older persons is done relying on anatomic body changes and Motion History Images (MHI). Elevation of the system performance was set up on a set of video frames received from the elderly residing in Mother Health Care Center in Sabzevar city and CAVIAR database containing the actual occurrence the of falling. Then, based on the standard deviation and the C-motion coefficient of the walking, suspected incident falls and actual falls are accurately segregated and finally, the sensitivity of 92.68% and the specificity of 96% were obtained which represent a desired capability of the output system. In overall, appropriate simulation of algorithms on the data set due to low error rate in which is less than 6% and meanwhile a careful monitoring of the elderly’s falls will be provided by implementing this system in elderly nursing and residential homes.}, keywords = {image processing,Motion history Image,Fall,Elderlies,Gaussian mixture model and Expectation maximization}, title_fa = {سیستم پایش زمین خوردن سالمندان بر مبنای مدل ترکیبی گوسی و تغییرات آناتومیکی بدن در تصاویر ویدئویی}, abstract_fa = {مطالعات نشان میدهد که 25% تا 47% سالمندان ساکن در جامعه یکبار یا بیشتر به زمین می خورند و این رقم در میان سالمندان آسایشگاهی به حدود 50% نیز می رسد. در این مقاله الگوریتم جدیدی معرفی شده که در گام نخست با دریافت رشته های ویدئویی از افراد، با استفاده از مدل مخلوط گوسی و تخمین پارامترهای این مدل توسط الگوریتم بیشینه ساز امید ریاضی، قالب بدن شخص از فریم ها جداسازی می شود. در گام بعدی، وقوع زمین خوردگی با تکیه بر تغییرات آناتومیکی بدن شخص سالمند و نمایش حافظه حرکت صورت می پذیرد. پیاده سازی سیستم بر مجموعه ای شامل چندین فریم تصویری دریافت شده از سرای سالمندان مادر سبزوار و پایگاه داده CAVIAR دربردارنده وقایع زمین خوردگی و راه رفتن طبیعی اشخاص انجام شد. در ادامه بر مبنای عامل انحراف استاندارد و ضریب حرکت فرد، وقایع مشکوک به زمین خوردگی و زمین خوردگی های واقعی با دقت مناسبی تفکیک شده و در نهایت حساسیت 68/92% و ویژگی 96% که نشان دهنده توانایی مطلوب سیستم می باشد، حاصل آمد. شبیه سازی  مناسب الگوریتم بر روی مجموعه داده ها سبب شده تا میزان خطا مقداری کمتر از  6% را داشته باشد و از سویی بکارگیری آن در مراکز نگهداری سالمندان و منازل مسکونی، مانیتورینگ دقیقی را از زمین خوردگی به همراه خواهد داشت. }, keywords_fa = {پردازش تصویر,حافظه حرکت,زمین خوردگی,سالمندان,مدل ترکیبی گوسین,بیشینه ساز امید ریاضی}, url = {https://jmvip.sinaweb.net/article_4532.html}, eprint = {https://jmvip.sinaweb.net/article_4532_35eb3129690af348ab6293e32db1c049.pdf} }