تخمین حالت سه‌بعدی بدن انسان از یک تصویر بوسیله شبکه عصبی کانولوشن و کدگذاری و بازنمایی تُنک با رویکرد مبتنی بر مدل

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجچوی کارشناسی ارشد مهندسی کامپیوتر، دانشگاه سمنان

2 داشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

3 دانشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

چکیده

در زمینه تخمین و ساخت اسکلت حالت سه‌بعدی بدن انسان از طریق بندهای بدن (body joints) بوسیله یک تصویر دوبعدی، چالش‌های عمق و خودانسدادی وجود دارد که مانع از تخمین دقیق می‌گردد. در این مقاله به تخمین حالت سه‌بعدی بدن انسان با دو رویکرد مختلف پرداخته شده است. بدین منظور، رویکرد اول پیشنهادی با تمرکز بر عمق حالت دوبعدی حقیقت اصلی بوسیله کدگذاری و بازنمایی تنک و تصحیح‌گر مبتنی بر مدل، حالت سه‌بعدی بدن انسان استخراج می‌شود. در رویکرد دوم پیشنهادی به‌کمک روش مبتنی بر یادگیری شبکه‌های عصبی کانولوشن، تخمین حالت دوبعدی بدن انسان بدست می‌آید، سپس بوسیله کدگذاری و بازنمایی تنک و تصحیح‌گر مبتنی بر مدل، تخمین عمق حالت استخراج می‌شود. نتایج حاصل از این روش، برتری تخمین حالت و عمق سه‌بعدی بدن انسان را نسبت به رویکردهای پیشین نشان می‌دهد. تخمین حالت‌های سه‌بعدی انجام شده در روش پیشنهادی نشان می‌دهد میانگین خطای بازسازی نسبت به کارهای  مشابه کاهش قابل توجهی داشته است

کلیدواژه‌ها