ORIGINAL_ARTICLE
کاهش ماتشدگی تصاویر دیجیتال با استفاده از نسخه بهبودیافته فیلتر هدایتشده مبتنی بر تغییرات کلی
امروزه حجم زیادی از تصاویر، توسط دوربینهای دیجیتال تولید میشوند. لیکن عواملی همچون ضعف در طراحی لنز دوربینها، منجر به ایجاد نویز در تصاویر می شود. روش های بهبود تصویر، ویژگی هایی از تصویر مانند لبه ها و مرزها را تیز می نمایند. لیکن تیزسازی لبه ها، خود منجر به افزایش نویز و ایجاد آثار تصنعی در تصاویر می شود. لذا استفاده از تکنیک های تیزسازی باید به صورت کنترل شده بوده و تا حدی انجام گیرد که جزئیات تصویر حفظ و نویز موجود در تصویر زیاد تقویت نشود. در این مقاله، روشی جدید جهت کاهش ماتی تصاویر دیجیتال ارائه شده است. روش پیشنهادی ترکیبی از فیلتر تغییرات کلی نسبی و فیلتر هدایت نورد در فضای رنگی HSV است. در روش پیشنهادی، نخست توسط فیلتر تغییرات کلی نسبی، ساختار تصویر استخراج و سپس توسط فیلتر هدایت نورد، بازیابی لبه ها انجام می شود. سپس با تفریق تصویر کانال روشنایی از تصویر حاصل از اعمال فیلتر هدایت نورد، جزئیات و لبه های اصلی تصویر استخراج می شوند. در یک روند تکرارپذیر و براساس میزان وضوح تصویر، جزئیات استخراج شده به کانال روشنایی افزوده می شود. در این روش، شدت روشنایی پیکسلهای تصویر به یک نسبت تغییر نمی کنند که این امر از ایجاد تحریفهای رنگی و افزایش نویز جلوگیری می کند.روش پیشنهادی بر روی تصاویر حاوی تحریفهای رنگی و تاری آزمایش شده است. نتایج آزمایش ها نشان می دهند که این روش جهت کاهش تاری 47%، جهت کنترل نویز 85% و جهت حفظ طبیعی بودن تصاویر 83% موثرتر از دیگر روشهای مورد مقایسه عمل کرده است.
https://jmvip.sinaweb.net/article_88439_ba1c4f1322068eeefa19366b72f39f2e.pdf
2020-08-22
1
16
بهبود تصویر
تیز نمودن تصویر
ماتشدگی تصاویر
فیلتر هدایت شده
اسما
رحیمی
asmarahimi46@gmail.com
1
دانشجوی کارشناسی ارشد مهندسی کامپیوتر، دانشگاه آزاد اسلامی شیراز، شیراز، ایران
AUTHOR
محمدامین
شایگان
shayegan@iaushiraz.ac.ir
2
گروه کامپیوتر ، دانشکده مهندسی، دانشگاه آزاد اسلامی شیراز، شیراز، ایران
LEAD_AUTHOR
ORIGINAL_ARTICLE
ارزیابی کیفیت تصاویر رنگی با استفاده از ویژگیهای ساختاری
هدف از ارزیابی کیفیت تصویر، ارائهٔ مدلی برای اندازهگیری کیفیت تصویر است به گونهای که مدل یاد شده بیشترین سازگاری با سیستم بینایی انسان را داشته باشد. در این مقاله روشی برای ارزیابی کیفیت تصاویر رنگی با استفاده از ترکیب سه ویژگی اندازه گرادیان، همفازی و برجستگیهای دیداری که ساختار تصویر را به شیوهٔ کارایی نمایش میدهند، ارائه شده است. این سه ویژگی ارتباط بسیار نزدیکی با سیستم بینایی انسان دارند، هر گونه تخریبی بر روی تصویر موجب ایجاد تغییراتی در این سه ویژگی میشود. در روش ارائه شده از اندازهٔ تغییرات این ویژگیها برای تخمین کیفیت دریافتی توسط سیستم بینایی انسان کمک گرفته شده است. نتایج آزمایشها بر روی مجموعه دادههای موجود نشان میدهد که الگوریتم مطرح شده همبستگی زیادی با معیار انسانی داشته و در مقایسه با روشهای موجود نتایج مطلوبی فراهم میکند.
https://jmvip.sinaweb.net/article_90112_afabc00b58ed8ab71378612cd1420f77.pdf
2020-08-22
17
28
ارزیابی کیفیت تصاویر رنگی
ارزیابی کیفیت مرجعکامل
سیستم بینایی انسان
همفازی
برجستگیهای دیداری
گونا
رحمانیانی
std_rahmaniani@khu.ac.ir
1
کارشناس ارشد معماری کامپیوتر
AUTHOR
آزاده
منصوری
a_mansouri@khu.ac.ir
2
دانشکده مهندسی برق و کامپیوتر، دانشگاه خوارزمی
LEAD_AUTHOR
ORIGINAL_ARTICLE
استفاده از سیگنالهای بالابهپایین مبتنی بر محتوا برای بهبود بازشناسی شییء
بازشناسی شییء در صحنههای پیچیدهی ازجمله تواناییهای شگرف سامانه بینایی انسان است که تاکنون مدلهای محاسباتی بینایی در پیادهسازی آن چندان موفق نبودهاند. در این راستا محققان سعی دارند با شناسایی سازوکار مغز و الهام از آن این مدل را بهبود بخشند. یکی از موفقترین مدلهای ارائهشده در بازشناسی شییء شبکههای عصبی کانولوشنی (CNN’s) هستند. این مدلها تنها قادر به شبیهسازی مسیر پیشروی بینایی انسان میباشند. با این حال شواهد مطالعات علوم اعصاب نشان میدهند سامانه بینایی انسان سیگنالهای بالابهپایین انتظار را در راستای افزایش دقت و سرعت بازشناسی شییء در زمینههای پیچیده به کار میبندد. در این مقاله با بهرهمندی از سیگنالهای بالابهپایین انتظار، سعی بر شبیهسازی مسیر بازخوردی سیستم بینایی انسان شده است. به این منظور مدل کانولوشنی AlexNet بهعنوان مسیر پیشرو سیستم بینایی استفاده شد. برای بازشناسی شییء از مدل آموزش یافته با مجموعه دادهی ImageNet و برای بازشناسی صحنه از مدل آموزش یافته با مجموعه تصاویر صحنه Places استفاده شد. شبکه آموزش دیده بر روی تصاویر صحنه (Place_CNN) برای تولید بردار بازخورد مبتنی بر اطلاعات حاصل از صحنه در نظر گرفته شد. سیگنالهای بازخوردی شامل اطلاعاتی از فراوانی تکرار شییء موردنظر در صحنهی جاری هستند. این سیگنالها با قاعدهی پسانتشار در قالب سیگنالهای بالابهپایین با اطلاعات مسیر پیشرو تلفیق و در شبکهی تشخیص شییء بازخورد میشوند. بهمنظور سنجش مدل پیشنهادی آزمایشهایی با استفاده از چند مجموعه داده صورت گرفت. نتایج نشان داد که ترکیب اطلاعات بازخوردی با مسیر پیشرو باعث بهبود معنی دار عملکرد مدل پیشنهادی نسبت به مدل پایهی AlexNet می شود. استفاده از اطلاعات محتوایی تصاویر باعث بهبود عملکرد بازشناسی شییء میشود بهخصوص هنگامی که شییء هدف در شرایط چالشی قرار گرفته است.
https://jmvip.sinaweb.net/article_91949_cb13c2afa962f92ba2241bd61926612d.pdf
2020-08-22
29
45
شبکه عصبی کانولوشنی
بازشناسی شییء
محتوا
شبکهی Place_CNN
شبکهی AlexNet
الهه
سلطاندوست ناری
elahe.soltandoostn@srttu.edu
1
کارشناس ارشد کامپیوتر، دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی
AUTHOR
رضا
ابراهیم پور
rebrahimpour@sru.ac.ir
2
دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی
LEAD_AUTHOR
کریم
رجایی
rajaei.k@ipm.ir
3
دانشجوی دکتری علوم اعصاب شناختی، پژوهشکده علومشناختی، پژوهشگاه دانشهای بنیادی
AUTHOR
ORIGINAL_ARTICLE
الگوریتمی تمام خودکار و مقاوم در برابر سایه برای تخمین سرعت و ابعاد خودروها از روی تصاویر دوربینهای نظارتی جاده
در این مقاله روشی قدرتمند و مقاوم به سایه برای تخمین سرعت و ابعاد خودروها بطور تمام خودکار، با استفاده از ویدئوی دوربین نظارتیِ جاده ارائه شده است. در روش پیشنهادی، در گام اول با بررسی چند قاب ابتدایی و با توجه به حرکت خودروها، مختصات نقاط محوشدگی و فاصله کانونی دوربین بدست می آید. سپس با شناسایی پیش زمینه و حذف سایه از آن، محدوده دقیق هر خودرو تعیین میشود و جعبه سه بُعدی محیطی برای هر خودرو تشکیل میگردد. پس از تصویر کردن خودرو بر صفحه فرضی جاده و حذف پرسپکتیو، ضریب متری (تبدیل پیکسل به متر) با توجه به ابعاد واقعی خودروی غالب محاسبه میشود. حذف پرسپکتیو و استفاده از ضریب متری، امکان تخمین سرعت و ابعاد خودروها در هر قاب را فراهم میکند. لیکن برای کاهش خطا با ردیابی هر خودرو این پارامترها در بازهای که خودرو در معرض دوربین قرار دارد، تجمیع شده و هیستوگرام هایی برای سرعت و ابعاد هر خودرو تشکیل میشود. سپس بیشینهی این هیستوگرام ها، به عنوان مقادیر سرعت و ابعاد هر خودرو گزارش میشود. مقایسه نتایج روش پیشنهادی با روشهای دیگر بیانگر خطای کمتر این روش است. به گونه ای که بیشترین خطا برای مجموعه های تست در تخمین سرعت برابر با km/h 1/17 و در تخمین ابعاد برابر با 2/6% است.
https://jmvip.sinaweb.net/article_92203_99e073288a43685446d4897b77392e13.pdf
2020-08-22
47
61
کالیبراسیون
پرسپکتیو
سایه
سرعت خودرو
ابعاد خودرو
رسول
عسگریان دهکردی
r_asgarian_dehkordi@yahoo.com
1
دانشجوی دکتر الکترونیک، دانشکده برق، دانشگاه صنعتی شاهرود
AUTHOR
حسین
خسروی
hosseinkhosravi@gmail.com
2
گروه مهندسی الکترونیک، دانشکده فنی و مهندسی، دانشگاه صنعتی شاهرود
LEAD_AUTHOR
ORIGINAL_ARTICLE
بهینهسازی ساختار هدف در سیستم ردیابی حرکت مبتنی بر دوربین
در ردیابی هدف با دوربین ساختار هدف بر دقت ردیابی بسیار تاثیر دارد. در این مقاله روشی جدید برای بهینهسازی محل قرار گرفتن پنج نشانگر بر روی یک هدف قابل رویت برای دوربین ارائه میگردد. تابع هدف پیشنهادی برای جایابی نشانگرها برابر با مجموع فاصله هر نشانگر از کلیه صفحاتی است که از ترکیب سهتاییهای بوجود آمده از سایر نشانگرها تشکیل میگردد. برای جلوگیری از متقارن شدن ساختار هدف که برچسب زنی نشانگرها را در تصویر ناممکن میسازد، از یک قید که تضمین میکند اختلاف فاصله بین زوج نشانگرها از یک حداقل بیشتر شود، استفاده مینماییم. برای حداکثر کردن تابع هدف پیشنهادی با قید اشاره شده از الگوریتم ژنتیک استفاده شده است.نتایج تجربی حاصل از جایابی نشانگرها در هدف با استفاده از روش پیشنهادی (با اعمال و بدون اعمال قید) و سایر روشها ارزیابی گردیدند. این روشها به لحاظ خطای تخمین وضعیت سهبعدی و سرعت ردیابی در حضور نویز مورد مقایسه قرار گرفتند. این نتایج کارایی روش پیشنهادی برای جایابی نشانگرها را تایید مینماید.
https://jmvip.sinaweb.net/article_92865_0da69ca565651584f963c569995b87aa.pdf
2020-08-22
63
75
ردیابی هدف مبتنی بر مدل
طراحی ساختار هدف
ردیابی مبتنی بر دوربین
ردیابی وضعیت سهبعدی
امیرحسین
نایبی آستانه
am_nayebi@yahoo.com
1
دانشکده مهندسی برق و رباتیک، دانشگاه صنعتی شاهرود
LEAD_AUTHOR
علیرضا
احمدی فرد
ahmadyfard@shahroodut.ac.ir
2
دانشکده مهندسی برق و رباتیک، دانشگاه صنعتی شاهرود
AUTHOR
ORIGINAL_ARTICLE
دستهبندی تومورهای مغزی براساس تجزیه مولفههای اساسی تنک ساختاریافته و الگوریتم فاکتورگیری ماتریس غیرمنفی تنک
تعیین نوع تومور مغزی براساس پردازش تصاویر امآرآی در کنار دانش پزشکی میتواند به تصمیمگیری درستی در مورد وضعیت بیمار منجر شود. در این راستا تشخیص خوشخیم یا بدخیم بودن تومور و انتخاب روش درمانی بر این اساس، به دلیل لزوم بررسی دقیق جزئیات بافت تومور و امکان بروز خطا میتواند به یک مبحث چالش برانگیز تبدیل شود. در این صورت پرداختن به این مسئله به کمک تکنیکهای پردازش تصویر میتواند اهمیت بسیاری داشته باشد. در این مقاله، تشخیص مناسب نوع تومور به کمک ویژگیهای بافتی و آماری تصویر و انتخاب بهترین بردار ویژگی صورت میگیرد. سپس از الگوریتم تحلیل مولفههای اساسی تنک ساختاریافته به منظور کاهش بُعد این دسته ویژگیها استفاده میشود. در ادامه بردارهای ویژگی حاصل به منظور آموزش مدلهای جامع بازنماییکننده ساختار داده مربوط به هر نوع تومور مغزی به کمک الگوریتم فاکتورگیری ماتریس غیرمنفی تنک مورد استفاده قرار میگیرند. دستهبندی دادهها در روش پیشنهادی براساس مقدار نرخ انرژی محاسبه شده برای ضرایب تنک صورت میگیرد. همچنین نتایج این دستهبندی با نتایج حاصل از طبقهبندهای مبتنیبر شبکه عصبی و ماشین بردار پشتیبان مقایسه گردیده است. نتایج شبیهسازیها نشان میدهدکه روش پیشنهادی مبتنیبر ویژگیهای ترکیبی آماری/بافتی قادر به دستهبندی انواع تومور مغزی با دقت بالا خواهد بود.
https://jmvip.sinaweb.net/article_95270_10c0d20713b647eb2e3995de3407ccb7.pdf
2020-08-22
77
91
طبقهبندی تومور مغزی
ویژگی مبتنیبر بافت
ویژگی آماری
تجزیه مولفههای اساسی تنک ساختاریافته
الگوریتم فاکتورگیری ماتریس غیرمنفی تنک
سمیرا
مودتی
s.mavaddati@umz.ac.ir
1
دانشکده فنی و مهندسی، دانشگاه مازندران، بابلسر، ایران
AUTHOR
ORIGINAL_ARTICLE
شناسایی چهره مقاوم نسبت به انسداد و تخریب برمبنای نمایش مشارکتی و کورآنتروپی
مدل تُنُک مبتنی بر معیار شباهت کورآنتروپی، نوعی مدل طبقهبندی یا شناسایی چهره مبتنی بر روش نمایش تُنُک است که نسبت به نویز و انسداد در دادههای آزمون، مقاوم است. در این مدل، ترکیبی خطی از تصاویر آموزشی، به نحوی تعیین میشود که برمبنای معیار کورآنتروپی، بیشترین شباهت را با داده آزمون داشته باشد و نُرم1 بردار ضرایب این ترکیب خطی، حداقل باشد. نُرم1، مشتقناپذیر است و لذا، نمیتوان برای حل این مدل، از روشهای کارآمد مبتنی بر گرادیان استفاده کرد. برای سادهسازی این مدل و حل سریعتر آن با روشهای مبتنی بر گرادیان، ضرایب ترکیب خطی، نامنفی در نظر گرفته شده است. قید نامنفی بودن ضرایب ترکیب خطی، قید محدودکنندهای است که در صحت طبقهبندی، تاثیر منفی میگذارد. در این مقاله، برای رفع این مشکل، بجای نُرم1 از نُرم2 بردار ضرایب ترکیب خطی، استفاده میشود و دو روش سریع برای حل مدل جدید ارائه میگردد. به تعبیر دیگر، مدل پیشنهادی، مدل شناسایی چهره مبتنی بر نمایش مشارکتی است که از مفهوم کورآنتروپی برای مقاوم شدن مدل در برابر نویز و انسداد استفاده کرده است. آزمایشهای انجام شده نشان میدهد که مدل پیشنهادی، نرخ صحت طبقهبندی و زمان اجرای بهتری نسبت به مدل نمایش تُنُک مبتنی بر کورآنتروپی با ضرایب نامنفی دارد.
https://jmvip.sinaweb.net/article_95838_aa5cc76a164f04087a3d1c922a210966.pdf
2020-08-22
93
109
طبقهبندی مبتنی بر نمایش تُنُک
نمایش مشارکتی
کورآنتروپی
طبقهبندی مقاوم
انسداد
تخریب
شادی
کلالی
kalali.shadi@gmail.com
1
کارشناس ارشد مهندسی کامپیوتر از دانشگاه آزاد اسلامی واحد مشهد
AUTHOR
یحیی
فرقانی
yforghani@mshdiau.ac.ir
2
گره مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد مشهد، مشهد، ایران
LEAD_AUTHOR
مجید
وفایی جهان
vafaeijahanmajid@gmail.com
3
گره مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد مشهد، مشهد، ایران
AUTHOR
ORIGINAL_ARTICLE
افزایش تفکیک پذیری تک تصویری با یادگیری از نواحی سگمنت شده تصویر ورودی
در این مقاله، یک روش جدید خودیادگیرنده برای افزایش تفکیک پذیری تک تصویر ارائه شده است. در این روش، از تصویر ورودی، دو هرمِ وضوح پایین و وضوح بالا ساخته می شود. رابطه بین وصله های هرم وضوح پایین و روشنایی متناظر وصلهها در تصویر هم سطح از هرم وضوح بالا توسط رگرسیون بردار پشتیبان یادگیری می شود. برای ایجاد تخمین بهتری از روشنایی وضوح بالا، تصاویر دو هرم را براساس رنگ ناحیه بندی می کنیم و مدل های رگرسیونی را برای هر ناحیه بطور مجزا آموزش می دهیم. از طرفی برای کاهش اثر تاری در لبه های تصویر فراتفکیک شده، مدل های جداگانه ای برای یادگیری روشنایی لبه ها ارائه شده است. ویژگی های بکار رفته در یادگیری رگرسیون بردار پشتیبان، ضرایب تُنُک وصله ها در بازنمایی تُنُک و گرادیان وصله ها میباشد. برای هر یک از ویژگی های اشاره شده مدل های رگرسیون مجزایی آموزش داده می شود و خطای این مدل ها نیز به کمک رگرسیون بردار پشتیبان مدل می گردد. در هنگام بازسازی تصویر فراتفکیک شده، هر وصلهی تصویر در بالاترین سطح هرم وضوح پایین به مدل های رگرسیونی داده شده و مدلی که کمترین خطا را در تخمین مقدار روشنایی ایجاد کند مشخص می گردد. روشنایی مرکز هر وصله را مدل برنده شده تعیین می کند. نتایج آزمایشات نشان میدهد که روش پیشنهادی نسبت به سایر روشها با توجه به معیار PSNR و SSIM تخمین بهتری از تصویر فراتفکیک شده ایجاد می کند. مشاهده بصری نتایج نیز این ادعا را تایید مینماید.
https://jmvip.sinaweb.net/article_97021_b4ec23cc4d0ca2e63a1787f5f73f73a1.pdf
2020-08-22
111
121
فراتفکیک پذیری تک تصویر
ناحیهبندی تصویر
بازنمایی تُنُک
رگرسیون بردار پشتیبان
ملیحه
حبیبی
habibi.malihe@gmail.com
1
دانشجوی دکتری مهندسی کامپیوتر گرایش هوش مصنوعی، دانشگاه صنعتی شاهرود
LEAD_AUTHOR
علیرضا
احمدی فرد
ahmadyfard@shahroodut.ac.ir
2
دانشکده مهندسی برق و رباتیک، دانشگاه صنعتی شاهرود
AUTHOR
حمید
حسن پور
h.hassanpour@shahroodut.ac.ir
3
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
AUTHOR
ORIGINAL_ARTICLE
طبقه بندی تصاویر هایپراسپکترال با استفاده از تجزیه تنسور زیرباند و شبکه عصبی پیچشی
در این مقاله، به موضوع طبقه بندی تصاویر ابرطیفی پرداخته می شود. با استفاده از روش های تجزیه، ماتریس یا تنسور تصویر ابرطیفی به دو ماتریس تجزیه می شود که یکی نمایانگر امضاهای طیفی مواد تشکیل دهنده تصویر می باشد و دیگری میزان فراوانی هر ماده در هر پیکسل را نشان می دهد. از آنجاییکه ذات تصویر ابرطیفی سه بعدی است، روش های تجزیه تنسور نامنفی بسیار بهتر به مساله منطبق هستند چرا که به جای به دنبال هم نشاندن اطلاعات مکانی در یک بردار ،اطلاعات مکانی را حفظ می کنند و ساختار همسایگی پیکسل ها در مدل لحاظ می شود. با هدف بهره گیری مشترک از اطلاعات مکانی و طیفی، کل طیف فرکانسی به چندین زیرباند تقسیم می شود و تجزیه روی هر زیر باند به صورت جداگانه صورت می پذیرد و ماتریس های فراوانی زیرباندها به دنبال هم قرار می گیرند و ماتریس ویژگی را می سازند. ماتریس فراوانی حاصل از روش های تجزیه تنسور نسبت به تجزیه ماتریس، به نتایج بهتری منجر می شود. آزمایشها بر روی سه مجموعه داده شناخته شده، مبین بهبود چشمگیر در دقت طبقه بندی حاصل با استفاده از روش پیشنهادی هستند. برای طبقه بندی از شبکه عصبی پیچشی سه بعدی استفاده شده است.
https://jmvip.sinaweb.net/article_99538_8e4ba8ad6f99b8864b42eb586b8fba54.pdf
2020-08-22
123
133
طبقه بندی تصاویر ابرطیفی
روش تجزیه تنسور نامنفی (NTF)
NTF در زیرباند (Subband NTF)
شبکه های عصبی پیچشی سه بعدی (3D-CNN)
سایه
میرزایی
s.mirzaei@ut.ac.ir
1
دانشکده علوم مهندسی، دانشکده فنی، دانشگاه تهران
LEAD_AUTHOR
جواد
حق شناس
j.haghshenas@isrc.ac.ir
2
پژوهشکده سامانه های ماهواره ای، پژوهشگاه فضایی ایران
AUTHOR
ORIGINAL_ARTICLE
حذف تناظرهای اشتباه بر مبنای ماتریس شکل در تناظریابی تصاویر با خط مبنای بلند
تناظریابی تصاویر با خط مبنای بلند و تغییرات شدید زاویه دید، نقش مهمی در بسیاری از کاربردها در ماشین بینایی و فتوگرامتری نظیر بازسازی سه بعدی و هممرجعسازی تصویر ایفا میکند. یکی از مشکلات اساسی تناظریابی این نوع از تصاویر وجود تعداد نسبتاً زیاد تناظرهای اشتباه است. بهمنظور حذف اشتباهات عموماً سازگاری هندسی تناظرها با استفاده از قیدهای هندسی مختلف نظیر خط اپیپولار و روشهای برآورد پایدار نظیر اجماع نمونه تصادفی، RANSAC (Random Sample Consensus)، کنترل میشود. این روشها در تصاویر با خط مبنای بلند به دلیل درصد بالای تناظرهای اشتباه دچار اشکال میشوند. در این مقاله روشی جدید برای حذف تناظرهای اشتباه در تناظریابی تصاویر با تغییر شدید زاویه دید ارائهشده است. برای این منظور، در ابتدا عوارض اولیه بیضیشکل با استفاده از الگوریتم بهبود یافته نواحی حدی بیشینه پایدار MSER (maximally stable extremal regions) در هر دو تصویر استخراج میشوند. سپس برای هر عارضه، توصیفگر متمایز DAISY محاسبه میشود. در مرحله بعد با مقایسه توصیفگرها در دو تصویر تناظرهای اولیه تعیین میشوند. در ادامه، تناظرهای اولیه با استفاده از یک روش جدید بر مبنای قیدهای هندسی مستخرج از ماتریس شکل عوارض با عنوان حذف اشتباهات تناظریابی بر مبنای ماتریس شکل، MESM (Mismatch elimination based on shape matrix) پالایش شده و بیشتر آنها شناسایی و حذف میشوند. در نهایت اشتباهات کم باقیمانده با بهرهگیری از یک قید هندسی حذف میشود. روش پیشنهادی بر روی هشت جفت تصویر بردکوتاه با تغییرات شدید زاویه دید اجرا شده و نتایج بیانگر قابلیت بالای آن در تناظریابی کارآمد تصاویر است.
https://jmvip.sinaweb.net/article_100566_db25210f7f1792128a05d6726d659d56.pdf
2020-08-22
135
151
تناظریابی
استخراج عوارض
MSER
DAISY
ماتریس شکل
امین
صداقت
a.sedaghat@tabrizu.ac.ir
1
گروه مهندسی نقشه برداری، دانشکده مهندسی عمران، تبریز، دانشگاه تبریز، ایران
LEAD_AUTHOR
نازیلا
محمدی
n.mohammadi@tabrizu.ac.ir
2
گروه مهندسی نقشه برداری، دانشکده مهندسی عمران، تبریز، دانشگاه تبریز، ایران
AUTHOR
ORIGINAL_ARTICLE
ویژگیهای آگاه به محتوا برای قطعهبندی معنایی تصویر
قطعه بندی معنایی تصویر مبتنی بر شبکه های عصبی عمیق، از رویکردهای مهم محققان بینایی ماشین می باشد. در روش های مبتنی بر شبکه های عصبی عمیق، بطور کلی از یک شبکه پایه که برای کاربرد شناسایی تصویر، آموزش دیده است، بمنظور استخراج ویژگی از تصویر استفاده میشود. از آنجا که ابعاد ویژگی های خروجی از این شبکه های پایه کوچکتر از تصویر ورودی می باشد، لذا با اضافه کردن چندین لایه کانولوشنی به انتهای این شبکه های پایه، ابعاد ویژگیهای خروجی از این شبکه ها را به اندازه ابعاد تصویر ورودی میرسانند. استفاده از ویژگی های محلی خروجی از شبکه های پایه، بدون در نظر گرفتن ارتباط کلی بین این ویژگی های محلی، منجر به قطعه بندی ضعیف و ناهموار می شود. بر این اساس، در این تحقیق واحدی با نام "واحد ویژگیهای آگاه به محتوا" پیشنهاد می شود. این واحد با کمک ویژگی های محلی خروجی از شبکه های پایه، ویژگی های سطح-تصویر ایجاد می کند. واحد پیشنهادی را میتوان در معماری های مختلف قطعه بندی معنایی تصویر قرار داد. در این تحقیق، با اضافه کردن واحد پیشنهادی CAF به معماریهای پایه FCN و DeepLab-v3-plus، به ترتیب معماریهای FCN-CAF و DeepLab-v3-plus-CAF پیشنهاد شده است. بمنظور آموزش معماریهای پیشنهادی از دادگان PASCAL VOC2012 استفاده شده است. نتایج آزمایش ها نشان می دهد که معماریهای پیشنهادی نسبت به معماریهای پایه مربوطه، به ترتیب 7/2 و 81/1درصد بهبود دقت (mIoU) دارد.
https://jmvip.sinaweb.net/article_103028_d316d317a533ae855984a089a0452671.pdf
2020-08-22
153
164
قطعه بندی معنایی تصویر
شبکه های عصبی عمیق
شبکه های عصبی کانولوشنی
واحد ویژگی های آگاه به محتوا
مجید
نصیری
majid.nasiri@sru.ac.ir
1
دانش آموخته کارشناسی ارشد هوش مصنوعی دانشگاه شهید رجایی
AUTHOR
حمیدرضا
رشیدی کنعان
h.rashidykanan@sru.ac.ir
2
دانشکده مهندسی کامپیوتر، دانشگاه شهید رجایی
LEAD_AUTHOR
سید حمید
امیری
s.hamidamiri@sru.ac.ir
3
دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی، تهران، ایران
AUTHOR
ORIGINAL_ARTICLE
بررسی تفصیلی الگوریتم تبدیل ویژگی مقیاس ثابت (SIFT)؛ مفاهیم، شاخص ها و کاربردها
الگوریتم تبدیل ویژگی مقیاس ثابت (SIFT)، یکی از الگوریتمهای پرکاربرد در زمینه بینایی ماشین است که به صورت گسترده مورد توجه و مطالعه پژوهشگران قرار گرفته و بهبود داده شده است. SIFT یکی از شناساگرهای محلی رایج میباشد که در انطباق تصویر، موزاییک تصویر، جعل کپی و جابجایی کاربرد دارد. در این مقاله مروری، ضمن معرفی الگوریتم SIFT، به کاربردها، مزایا و معایب، اصلاحات، دستهبندیها و رویکردهای تحقیقات جدید در این الگوریتم پرداخته شدهاست. علاوه بر این، به کمک چهار آزمایش، جنبههای مختلف الگوریتم مورد ارزیابی قرار گرفتهاست. این مقاله میتواند راهگشای پژوهشگران پردازش تصویر برای استفاده از الگوریتم SIFT باشد. اهتمام نویسندگان بر این بوده است که همه جنبههای این الگوریتم مورد کاوش قرار گیرد.
https://jmvip.sinaweb.net/article_106107_68269418f56ce0ecd57d790a9e302e59.pdf
2020-08-22
165
190
نقاط کلیدی
شناساگر
توصیفگر
الگوریتم تبدیل ویژگی مقیاس ثابت (SIFT)
تطبیق
زهرا
حسین نژاد
hoseinnejad.zahra@yahoo.com
1
گروه مهندسی برق واحد شیراز، دانشگاه آزاد اسلامی- شیراز- ایران
AUTHOR
حامد
آگاهی
agahi@iaushiraz.ac.ir
2
گروه مهندسی برق واحد شیراز، دانشگاه آزاد اسلامی- شیراز- ایران
LEAD_AUTHOR
آذر
محمودزاده
azar_mahmoodzadeh@yahoo.com
3
گروه مهندسی برق واحد شیراز، دانشگاه آزاد اسلامی- شیراز- ایران
AUTHOR