2024-03-28T21:51:14Z
https://jmvip.sinaweb.net/?_action=export&rf=summon&issue=15698
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
کاهش ماتشدگی تصاویر دیجیتال با استفاده از نسخه بهبودیافته فیلتر هدایتشده مبتنی بر تغییرات کلی
اسما
رحیمی
محمدامین
شایگان
امروزه حجم زیادی از تصاویر، توسط دوربینهای دیجیتال تولید میشوند. لیکن عواملی همچون ضعف در طراحی لنز دوربینها، منجر به ایجاد نویز در تصاویر می شود. روش های بهبود تصویر، ویژگی هایی از تصویر مانند لبه ها و مرزها را تیز می نمایند. لیکن تیزسازی لبه ها، خود منجر به افزایش نویز و ایجاد آثار تصنعی در تصاویر می شود. لذا استفاده از تکنیک های تیزسازی باید به صورت کنترل شده بوده و تا حدی انجام گیرد که جزئیات تصویر حفظ و نویز موجود در تصویر زیاد تقویت نشود. در این مقاله، روشی جدید جهت کاهش ماتی تصاویر دیجیتال ارائه شده است. روش پیشنهادی ترکیبی از فیلتر تغییرات کلی نسبی و فیلتر هدایت نورد در فضای رنگی HSV است. در روش پیشنهادی، نخست توسط فیلتر تغییرات کلی نسبی، ساختار تصویر استخراج و سپس توسط فیلتر هدایت نورد، بازیابی لبه ها انجام می شود. سپس با تفریق تصویر کانال روشنایی از تصویر حاصل از اعمال فیلتر هدایت نورد، جزئیات و لبه های اصلی تصویر استخراج می شوند. در یک روند تکرارپذیر و براساس میزان وضوح تصویر، جزئیات استخراج شده به کانال روشنایی افزوده می شود. در این روش، شدت روشنایی پیکسلهای تصویر به یک نسبت تغییر نمی کنند که این امر از ایجاد تحریفهای رنگی و افزایش نویز جلوگیری می کند.روش پیشنهادی بر روی تصاویر حاوی تحریفهای رنگی و تاری آزمایش شده است. نتایج آزمایش ها نشان می دهند که این روش جهت کاهش تاری 47%، جهت کنترل نویز 85% و جهت حفظ طبیعی بودن تصاویر 83% موثرتر از دیگر روشهای مورد مقایسه عمل کرده است.
بهبود تصویر
تیز نمودن تصویر
ماتشدگی تصاویر
فیلتر هدایت شده
2020
08
22
1
16
https://jmvip.sinaweb.net/article_88439_ba1c4f1322068eeefa19366b72f39f2e.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
ارزیابی کیفیت تصاویر رنگی با استفاده از ویژگیهای ساختاری
گونا
رحمانیانی
آزاده
منصوری
هدف از ارزیابی کیفیت تصویر، ارائهٔ مدلی برای اندازهگیری کیفیت تصویر است به گونهای که مدل یاد شده بیشترین سازگاری با سیستم بینایی انسان را داشته باشد. در این مقاله روشی برای ارزیابی کیفیت تصاویر رنگی با استفاده از ترکیب سه ویژگی اندازه گرادیان، همفازی و برجستگیهای دیداری که ساختار تصویر را به شیوهٔ کارایی نمایش میدهند، ارائه شده است. این سه ویژگی ارتباط بسیار نزدیکی با سیستم بینایی انسان دارند، هر گونه تخریبی بر روی تصویر موجب ایجاد تغییراتی در این سه ویژگی میشود. در روش ارائه شده از اندازهٔ تغییرات این ویژگیها برای تخمین کیفیت دریافتی توسط سیستم بینایی انسان کمک گرفته شده است. نتایج آزمایشها بر روی مجموعه دادههای موجود نشان میدهد که الگوریتم مطرح شده همبستگی زیادی با معیار انسانی داشته و در مقایسه با روشهای موجود نتایج مطلوبی فراهم میکند.
ارزیابی کیفیت تصاویر رنگی
ارزیابی کیفیت مرجعکامل
سیستم بینایی انسان
همفازی
برجستگیهای دیداری
2020
08
22
17
28
https://jmvip.sinaweb.net/article_90112_afabc00b58ed8ab71378612cd1420f77.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
استفاده از سیگنالهای بالابهپایین مبتنی بر محتوا برای بهبود بازشناسی شییء
الهه
سلطاندوست ناری
رضا
ابراهیم پور
کریم
رجایی
بازشناسی شییء در صحنههای پیچیدهی ازجمله تواناییهای شگرف سامانه بینایی انسان است که تاکنون مدلهای محاسباتی بینایی در پیادهسازی آن چندان موفق نبودهاند. در این راستا محققان سعی دارند با شناسایی سازوکار مغز و الهام از آن این مدل را بهبود بخشند. یکی از موفقترین مدلهای ارائهشده در بازشناسی شییء شبکههای عصبی کانولوشنی (CNN’s) هستند. این مدلها تنها قادر به شبیهسازی مسیر پیشروی بینایی انسان میباشند. با این حال شواهد مطالعات علوم اعصاب نشان میدهند سامانه بینایی انسان سیگنالهای بالابهپایین انتظار را در راستای افزایش دقت و سرعت بازشناسی شییء در زمینههای پیچیده به کار میبندد. در این مقاله با بهرهمندی از سیگنالهای بالابهپایین انتظار، سعی بر شبیهسازی مسیر بازخوردی سیستم بینایی انسان شده است. به این منظور مدل کانولوشنی AlexNet بهعنوان مسیر پیشرو سیستم بینایی استفاده شد. برای بازشناسی شییء از مدل آموزش یافته با مجموعه دادهی ImageNet و برای بازشناسی صحنه از مدل آموزش یافته با مجموعه تصاویر صحنه Places استفاده شد. شبکه آموزش دیده بر روی تصاویر صحنه (Place_CNN) برای تولید بردار بازخورد مبتنی بر اطلاعات حاصل از صحنه در نظر گرفته شد. سیگنالهای بازخوردی شامل اطلاعاتی از فراوانی تکرار شییء موردنظر در صحنهی جاری هستند. این سیگنالها با قاعدهی پسانتشار در قالب سیگنالهای بالابهپایین با اطلاعات مسیر پیشرو تلفیق و در شبکهی تشخیص شییء بازخورد میشوند. بهمنظور سنجش مدل پیشنهادی آزمایشهایی با استفاده از چند مجموعه داده صورت گرفت. نتایج نشان داد که ترکیب اطلاعات بازخوردی با مسیر پیشرو باعث بهبود معنی دار عملکرد مدل پیشنهادی نسبت به مدل پایهی AlexNet می شود. استفاده از اطلاعات محتوایی تصاویر باعث بهبود عملکرد بازشناسی شییء میشود بهخصوص هنگامی که شییء هدف در شرایط چالشی قرار گرفته است.
شبکه عصبی کانولوشنی
بازشناسی شییء
محتوا
شبکهی Place_CNN
شبکهی AlexNet
2020
08
22
29
45
https://jmvip.sinaweb.net/article_91949_cb13c2afa962f92ba2241bd61926612d.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
الگوریتمی تمام خودکار و مقاوم در برابر سایه برای تخمین سرعت و ابعاد خودروها از روی تصاویر دوربینهای نظارتی جاده
رسول
عسگریان دهکردی
حسین
خسروی
در این مقاله روشی قدرتمند و مقاوم به سایه برای تخمین سرعت و ابعاد خودروها بطور تمام خودکار، با استفاده از ویدئوی دوربین نظارتیِ جاده ارائه شده است. در روش پیشنهادی، در گام اول با بررسی چند قاب ابتدایی و با توجه به حرکت خودروها، مختصات نقاط محوشدگی و فاصله کانونی دوربین بدست می آید. سپس با شناسایی پیش زمینه و حذف سایه از آن، محدوده دقیق هر خودرو تعیین میشود و جعبه سه بُعدی محیطی برای هر خودرو تشکیل میگردد. پس از تصویر کردن خودرو بر صفحه فرضی جاده و حذف پرسپکتیو، ضریب متری (تبدیل پیکسل به متر) با توجه به ابعاد واقعی خودروی غالب محاسبه میشود. حذف پرسپکتیو و استفاده از ضریب متری، امکان تخمین سرعت و ابعاد خودروها در هر قاب را فراهم میکند. لیکن برای کاهش خطا با ردیابی هر خودرو این پارامترها در بازهای که خودرو در معرض دوربین قرار دارد، تجمیع شده و هیستوگرام هایی برای سرعت و ابعاد هر خودرو تشکیل میشود. سپس بیشینهی این هیستوگرام ها، به عنوان مقادیر سرعت و ابعاد هر خودرو گزارش میشود. مقایسه نتایج روش پیشنهادی با روشهای دیگر بیانگر خطای کمتر این روش است. به گونه ای که بیشترین خطا برای مجموعه های تست در تخمین سرعت برابر با km/h 1/17 و در تخمین ابعاد برابر با 2/6% است.
کالیبراسیون
پرسپکتیو
سایه
سرعت خودرو
ابعاد خودرو
2020
08
22
47
61
https://jmvip.sinaweb.net/article_92203_99e073288a43685446d4897b77392e13.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
بهینهسازی ساختار هدف در سیستم ردیابی حرکت مبتنی بر دوربین
امیرحسین
نایبی آستانه
علیرضا
احمدی فرد
در ردیابی هدف با دوربین ساختار هدف بر دقت ردیابی بسیار تاثیر دارد. در این مقاله روشی جدید برای بهینهسازی محل قرار گرفتن پنج نشانگر بر روی یک هدف قابل رویت برای دوربین ارائه میگردد. تابع هدف پیشنهادی برای جایابی نشانگرها برابر با مجموع فاصله هر نشانگر از کلیه صفحاتی است که از ترکیب سهتاییهای بوجود آمده از سایر نشانگرها تشکیل میگردد. برای جلوگیری از متقارن شدن ساختار هدف که برچسب زنی نشانگرها را در تصویر ناممکن میسازد، از یک قید که تضمین میکند اختلاف فاصله بین زوج نشانگرها از یک حداقل بیشتر شود، استفاده مینماییم. برای حداکثر کردن تابع هدف پیشنهادی با قید اشاره شده از الگوریتم ژنتیک استفاده شده است.نتایج تجربی حاصل از جایابی نشانگرها در هدف با استفاده از روش پیشنهادی (با اعمال و بدون اعمال قید) و سایر روشها ارزیابی گردیدند. این روشها به لحاظ خطای تخمین وضعیت سهبعدی و سرعت ردیابی در حضور نویز مورد مقایسه قرار گرفتند. این نتایج کارایی روش پیشنهادی برای جایابی نشانگرها را تایید مینماید.
ردیابی هدف مبتنی بر مدل
طراحی ساختار هدف
ردیابی مبتنی بر دوربین
ردیابی وضعیت سهبعدی
2020
08
22
63
75
https://jmvip.sinaweb.net/article_92865_0da69ca565651584f963c569995b87aa.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
دستهبندی تومورهای مغزی براساس تجزیه مولفههای اساسی تنک ساختاریافته و الگوریتم فاکتورگیری ماتریس غیرمنفی تنک
سمیرا
مودتی
تعیین نوع تومور مغزی براساس پردازش تصاویر امآرآی در کنار دانش پزشکی میتواند به تصمیمگیری درستی در مورد وضعیت بیمار منجر شود. در این راستا تشخیص خوشخیم یا بدخیم بودن تومور و انتخاب روش درمانی بر این اساس، به دلیل لزوم بررسی دقیق جزئیات بافت تومور و امکان بروز خطا میتواند به یک مبحث چالش برانگیز تبدیل شود. در این صورت پرداختن به این مسئله به کمک تکنیکهای پردازش تصویر میتواند اهمیت بسیاری داشته باشد. در این مقاله، تشخیص مناسب نوع تومور به کمک ویژگیهای بافتی و آماری تصویر و انتخاب بهترین بردار ویژگی صورت میگیرد. سپس از الگوریتم تحلیل مولفههای اساسی تنک ساختاریافته به منظور کاهش بُعد این دسته ویژگیها استفاده میشود. در ادامه بردارهای ویژگی حاصل به منظور آموزش مدلهای جامع بازنماییکننده ساختار داده مربوط به هر نوع تومور مغزی به کمک الگوریتم فاکتورگیری ماتریس غیرمنفی تنک مورد استفاده قرار میگیرند. دستهبندی دادهها در روش پیشنهادی براساس مقدار نرخ انرژی محاسبه شده برای ضرایب تنک صورت میگیرد. همچنین نتایج این دستهبندی با نتایج حاصل از طبقهبندهای مبتنیبر شبکه عصبی و ماشین بردار پشتیبان مقایسه گردیده است. نتایج شبیهسازیها نشان میدهدکه روش پیشنهادی مبتنیبر ویژگیهای ترکیبی آماری/بافتی قادر به دستهبندی انواع تومور مغزی با دقت بالا خواهد بود.
طبقهبندی تومور مغزی
ویژگی مبتنیبر بافت
ویژگی آماری
تجزیه مولفههای اساسی تنک ساختاریافته
الگوریتم فاکتورگیری ماتریس غیرمنفی تنک
2020
08
22
77
91
https://jmvip.sinaweb.net/article_95270_10c0d20713b647eb2e3995de3407ccb7.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
شناسایی چهره مقاوم نسبت به انسداد و تخریب برمبنای نمایش مشارکتی و کورآنتروپی
شادی
کلالی
یحیی
فرقانی
مجید
وفایی جهان
مدل تُنُک مبتنی بر معیار شباهت کورآنتروپی، نوعی مدل طبقهبندی یا شناسایی چهره مبتنی بر روش نمایش تُنُک است که نسبت به نویز و انسداد در دادههای آزمون، مقاوم است. در این مدل، ترکیبی خطی از تصاویر آموزشی، به نحوی تعیین میشود که برمبنای معیار کورآنتروپی، بیشترین شباهت را با داده آزمون داشته باشد و نُرم1 بردار ضرایب این ترکیب خطی، حداقل باشد. نُرم1، مشتقناپذیر است و لذا، نمیتوان برای حل این مدل، از روشهای کارآمد مبتنی بر گرادیان استفاده کرد. برای سادهسازی این مدل و حل سریعتر آن با روشهای مبتنی بر گرادیان، ضرایب ترکیب خطی، نامنفی در نظر گرفته شده است. قید نامنفی بودن ضرایب ترکیب خطی، قید محدودکنندهای است که در صحت طبقهبندی، تاثیر منفی میگذارد. در این مقاله، برای رفع این مشکل، بجای نُرم1 از نُرم2 بردار ضرایب ترکیب خطی، استفاده میشود و دو روش سریع برای حل مدل جدید ارائه میگردد. به تعبیر دیگر، مدل پیشنهادی، مدل شناسایی چهره مبتنی بر نمایش مشارکتی است که از مفهوم کورآنتروپی برای مقاوم شدن مدل در برابر نویز و انسداد استفاده کرده است. آزمایشهای انجام شده نشان میدهد که مدل پیشنهادی، نرخ صحت طبقهبندی و زمان اجرای بهتری نسبت به مدل نمایش تُنُک مبتنی بر کورآنتروپی با ضرایب نامنفی دارد.
طبقهبندی مبتنی بر نمایش تُنُک
نمایش مشارکتی
کورآنتروپی
طبقهبندی مقاوم
انسداد
تخریب
2020
08
22
93
109
https://jmvip.sinaweb.net/article_95838_aa5cc76a164f04087a3d1c922a210966.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
افزایش تفکیک پذیری تک تصویری با یادگیری از نواحی سگمنت شده تصویر ورودی
ملیحه
حبیبی
علیرضا
احمدی فرد
حمید
حسن پور
در این مقاله، یک روش جدید خودیادگیرنده برای افزایش تفکیک پذیری تک تصویر ارائه شده است. در این روش، از تصویر ورودی، دو هرمِ وضوح پایین و وضوح بالا ساخته می شود. رابطه بین وصله های هرم وضوح پایین و روشنایی متناظر وصلهها در تصویر هم سطح از هرم وضوح بالا توسط رگرسیون بردار پشتیبان یادگیری می شود. برای ایجاد تخمین بهتری از روشنایی وضوح بالا، تصاویر دو هرم را براساس رنگ ناحیه بندی می کنیم و مدل های رگرسیونی را برای هر ناحیه بطور مجزا آموزش می دهیم. از طرفی برای کاهش اثر تاری در لبه های تصویر فراتفکیک شده، مدل های جداگانه ای برای یادگیری روشنایی لبه ها ارائه شده است. ویژگی های بکار رفته در یادگیری رگرسیون بردار پشتیبان، ضرایب تُنُک وصله ها در بازنمایی تُنُک و گرادیان وصله ها میباشد. برای هر یک از ویژگی های اشاره شده مدل های رگرسیون مجزایی آموزش داده می شود و خطای این مدل ها نیز به کمک رگرسیون بردار پشتیبان مدل می گردد. در هنگام بازسازی تصویر فراتفکیک شده، هر وصلهی تصویر در بالاترین سطح هرم وضوح پایین به مدل های رگرسیونی داده شده و مدلی که کمترین خطا را در تخمین مقدار روشنایی ایجاد کند مشخص می گردد. روشنایی مرکز هر وصله را مدل برنده شده تعیین می کند. نتایج آزمایشات نشان میدهد که روش پیشنهادی نسبت به سایر روشها با توجه به معیار PSNR و SSIM تخمین بهتری از تصویر فراتفکیک شده ایجاد می کند. مشاهده بصری نتایج نیز این ادعا را تایید مینماید.
فراتفکیک پذیری تک تصویر
ناحیهبندی تصویر
بازنمایی تُنُک
رگرسیون بردار پشتیبان
2020
08
22
111
121
https://jmvip.sinaweb.net/article_97021_b4ec23cc4d0ca2e63a1787f5f73f73a1.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
طبقه بندی تصاویر هایپراسپکترال با استفاده از تجزیه تنسور زیرباند و شبکه عصبی پیچشی
سایه
میرزایی
جواد
حق شناس
در این مقاله، به موضوع طبقه بندی تصاویر ابرطیفی پرداخته می شود. با استفاده از روش های تجزیه، ماتریس یا تنسور تصویر ابرطیفی به دو ماتریس تجزیه می شود که یکی نمایانگر امضاهای طیفی مواد تشکیل دهنده تصویر می باشد و دیگری میزان فراوانی هر ماده در هر پیکسل را نشان می دهد. از آنجاییکه ذات تصویر ابرطیفی سه بعدی است، روش های تجزیه تنسور نامنفی بسیار بهتر به مساله منطبق هستند چرا که به جای به دنبال هم نشاندن اطلاعات مکانی در یک بردار ،اطلاعات مکانی را حفظ می کنند و ساختار همسایگی پیکسل ها در مدل لحاظ می شود. با هدف بهره گیری مشترک از اطلاعات مکانی و طیفی، کل طیف فرکانسی به چندین زیرباند تقسیم می شود و تجزیه روی هر زیر باند به صورت جداگانه صورت می پذیرد و ماتریس های فراوانی زیرباندها به دنبال هم قرار می گیرند و ماتریس ویژگی را می سازند. ماتریس فراوانی حاصل از روش های تجزیه تنسور نسبت به تجزیه ماتریس، به نتایج بهتری منجر می شود. آزمایشها بر روی سه مجموعه داده شناخته شده، مبین بهبود چشمگیر در دقت طبقه بندی حاصل با استفاده از روش پیشنهادی هستند. برای طبقه بندی از شبکه عصبی پیچشی سه بعدی استفاده شده است.
طبقه بندی تصاویر ابرطیفی
روش تجزیه تنسور نامنفی (NTF)
NTF در زیرباند (Subband NTF)
شبکه های عصبی پیچشی سه بعدی (3D-CNN)
2020
08
22
123
133
https://jmvip.sinaweb.net/article_99538_8e4ba8ad6f99b8864b42eb586b8fba54.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
حذف تناظرهای اشتباه بر مبنای ماتریس شکل در تناظریابی تصاویر با خط مبنای بلند
امین
صداقت
نازیلا
محمدی
تناظریابی تصاویر با خط مبنای بلند و تغییرات شدید زاویه دید، نقش مهمی در بسیاری از کاربردها در ماشین بینایی و فتوگرامتری نظیر بازسازی سه بعدی و هممرجعسازی تصویر ایفا میکند. یکی از مشکلات اساسی تناظریابی این نوع از تصاویر وجود تعداد نسبتاً زیاد تناظرهای اشتباه است. بهمنظور حذف اشتباهات عموماً سازگاری هندسی تناظرها با استفاده از قیدهای هندسی مختلف نظیر خط اپیپولار و روشهای برآورد پایدار نظیر اجماع نمونه تصادفی، RANSAC (Random Sample Consensus)، کنترل میشود. این روشها در تصاویر با خط مبنای بلند به دلیل درصد بالای تناظرهای اشتباه دچار اشکال میشوند. در این مقاله روشی جدید برای حذف تناظرهای اشتباه در تناظریابی تصاویر با تغییر شدید زاویه دید ارائهشده است. برای این منظور، در ابتدا عوارض اولیه بیضیشکل با استفاده از الگوریتم بهبود یافته نواحی حدی بیشینه پایدار MSER (maximally stable extremal regions) در هر دو تصویر استخراج میشوند. سپس برای هر عارضه، توصیفگر متمایز DAISY محاسبه میشود. در مرحله بعد با مقایسه توصیفگرها در دو تصویر تناظرهای اولیه تعیین میشوند. در ادامه، تناظرهای اولیه با استفاده از یک روش جدید بر مبنای قیدهای هندسی مستخرج از ماتریس شکل عوارض با عنوان حذف اشتباهات تناظریابی بر مبنای ماتریس شکل، MESM (Mismatch elimination based on shape matrix) پالایش شده و بیشتر آنها شناسایی و حذف میشوند. در نهایت اشتباهات کم باقیمانده با بهرهگیری از یک قید هندسی حذف میشود. روش پیشنهادی بر روی هشت جفت تصویر بردکوتاه با تغییرات شدید زاویه دید اجرا شده و نتایج بیانگر قابلیت بالای آن در تناظریابی کارآمد تصاویر است.
تناظریابی
استخراج عوارض
MSER
DAISY
ماتریس شکل
2020
08
22
135
151
https://jmvip.sinaweb.net/article_100566_db25210f7f1792128a05d6726d659d56.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
ویژگیهای آگاه به محتوا برای قطعهبندی معنایی تصویر
مجید
نصیری
حمیدرضا
رشیدی کنعان
سید حمید
امیری
قطعه بندی معنایی تصویر مبتنی بر شبکه های عصبی عمیق، از رویکردهای مهم محققان بینایی ماشین می باشد. در روش های مبتنی بر شبکه های عصبی عمیق، بطور کلی از یک شبکه پایه که برای کاربرد شناسایی تصویر، آموزش دیده است، بمنظور استخراج ویژگی از تصویر استفاده میشود. از آنجا که ابعاد ویژگی های خروجی از این شبکه های پایه کوچکتر از تصویر ورودی می باشد، لذا با اضافه کردن چندین لایه کانولوشنی به انتهای این شبکه های پایه، ابعاد ویژگیهای خروجی از این شبکه ها را به اندازه ابعاد تصویر ورودی میرسانند. استفاده از ویژگی های محلی خروجی از شبکه های پایه، بدون در نظر گرفتن ارتباط کلی بین این ویژگی های محلی، منجر به قطعه بندی ضعیف و ناهموار می شود. بر این اساس، در این تحقیق واحدی با نام "واحد ویژگیهای آگاه به محتوا" پیشنهاد می شود. این واحد با کمک ویژگی های محلی خروجی از شبکه های پایه، ویژگی های سطح-تصویر ایجاد می کند. واحد پیشنهادی را میتوان در معماری های مختلف قطعه بندی معنایی تصویر قرار داد. در این تحقیق، با اضافه کردن واحد پیشنهادی CAF به معماریهای پایه FCN و DeepLab-v3-plus، به ترتیب معماریهای FCN-CAF و DeepLab-v3-plus-CAF پیشنهاد شده است. بمنظور آموزش معماریهای پیشنهادی از دادگان PASCAL VOC2012 استفاده شده است. نتایج آزمایش ها نشان می دهد که معماریهای پیشنهادی نسبت به معماریهای پایه مربوطه، به ترتیب 7/2 و 81/1درصد بهبود دقت (mIoU) دارد.
قطعه بندی معنایی تصویر
شبکه های عصبی عمیق
شبکه های عصبی کانولوشنی
واحد ویژگی های آگاه به محتوا
2020
08
22
153
164
https://jmvip.sinaweb.net/article_103028_d316d317a533ae855984a089a0452671.pdf
مجله بینایی ماشین و پردازش تصویر
JMVIP
1399
7
1
بررسی تفصیلی الگوریتم تبدیل ویژگی مقیاس ثابت (SIFT)؛ مفاهیم، شاخص ها و کاربردها
زهرا
حسین نژاد
حامد
آگاهی
آذر
محمودزاده
الگوریتم تبدیل ویژگی مقیاس ثابت (SIFT)، یکی از الگوریتمهای پرکاربرد در زمینه بینایی ماشین است که به صورت گسترده مورد توجه و مطالعه پژوهشگران قرار گرفته و بهبود داده شده است. SIFT یکی از شناساگرهای محلی رایج میباشد که در انطباق تصویر، موزاییک تصویر، جعل کپی و جابجایی کاربرد دارد. در این مقاله مروری، ضمن معرفی الگوریتم SIFT، به کاربردها، مزایا و معایب، اصلاحات، دستهبندیها و رویکردهای تحقیقات جدید در این الگوریتم پرداخته شدهاست. علاوه بر این، به کمک چهار آزمایش، جنبههای مختلف الگوریتم مورد ارزیابی قرار گرفتهاست. این مقاله میتواند راهگشای پژوهشگران پردازش تصویر برای استفاده از الگوریتم SIFT باشد. اهتمام نویسندگان بر این بوده است که همه جنبههای این الگوریتم مورد کاوش قرار گیرد.
نقاط کلیدی
شناساگر
توصیفگر
الگوریتم تبدیل ویژگی مقیاس ثابت (SIFT)
تطبیق
2020
08
22
165
190
https://jmvip.sinaweb.net/article_106107_68269418f56ce0ecd57d790a9e302e59.pdf