مروری بر سیستم‌های تحلیل محتوایی و معنایی ویدیو از دیدگاه ساختار سلسله مراتب معنایی در تولید فیلم

نوع مقاله: مقاله مروری

نویسندگان

1 دانشگاه تهران، دانشکده مهندسی برق و کامیپیوتر

2 دانشگاه تهران، دانشکده مهندسی برق و کامیپیوتر و آزمایشگاه تحلیل تصویر، بخش رادیولوژی، بیمارستان هنری فورد، دیترویت، میشیگان، ایالات متحده آمریکا

3 دانشگاه فردوسی مشهد، گروه مهندسی کامپیوتر

چکیده

سیستم‌های تحلیل معنایی ویدیو به دسته‌ای از سیستم‌ها اطلاق می‌شود که نوعی ابزار هوشمند جهت بررسی و تحلیل محتوایی و معنایی ویدیو می‌باشند. بررسی و دسته‌بندی این سیستم‌ها می‌تواند از دیدگاه‌های مختلف انجام شود. در این مقاله سعیشدهبر اساس یک ساختار سلسله مراتبی که از نحوه تولید فیلم توسط یک فیلم‌ساز برگرفته شده است، سیستم‌های تحلیل معنایی ویدیواز نظر شکاف معنایی میان ویژگی‌های سطح پایین و مفاهیم سطح بالا مورد بررسی قرار گیرند. به این ترتیب، پس از معرفی سیستم‌های تحلیل معنایی ویدیو، دو چالش اصلی در این سیستم‌ها مطرح می‌شود: شکاف حسگری و شکاف معنایی. پس از آن با ارائه یکساختار سلسله مراتبی مبتنی بر نحوه ساخت فیلم، چگونگی کاهش شکاف معنایی در سیستم‌های تحلیل ویدیو مورد بررسی قرار گرفته و تحقیقات انجام شده در این زمینه مرور می‌شود. بر اساس این ساختار، سیستم‌های تحلیل ویدیو در سه سطح دسته‌بندی و مرور می‌شوند: پردازش فریم‌ها، استخراج محتوا و استخراج معنا. در نهایت مشکلات و مسائل باز در سیستم‌های کنونی تحلیل معنایی ویدیو بازگو می‌گردد. مهمترین مشکلات در این زمینه عبارتند از: تنوع رویدادها و مفاهیم در یک ویدیو، ‌امکان وجود معانی و مفاهیم متعدد براییک رویداد معین، پردازش‌های بلندمدت برای استخراج معانی و مفاهیم و استفاده و ترکیب داده‌های چندنوعی. به این ترتیب، با مروری بر مقالات، مسیرهای تحقیقاتی فعلی و مشکلات پیشرو در زمینه سیستم‌های تحلیل معنایی ویدیو معرفی خواهد شد.

کلیدواژه‌ها