شبکه‌ی تصویری تصویرنت (تجربیات، چالش‌ها و ابزارهای بومی‌سازی شبکه‌ی تصویری ImageNet)

نوع مقاله: مقاله پژوهشی

نویسندگان

گروه سکوهای فناوری اطلاعات، پژوهشکده فناوری اطلاعات، پزوهشگاه ارتباطات و فناوری اطلاعات، تهران، ایران

چکیده

پایگاه های دادگان تصویری بزرگ به عنوان محتوای آموزشی در کاربردهای هوش بصری و همچنین الگوریتم های یادگیری عمیق مورد استفاده قرار میگیرند. شبکه‌ی تصویریِ تصویرنت، پایگاه داده‌ای ‌‌سلسله‌مراتبی از تصاویر و مطابق با فرهنگ ایرانی و اسلامی است که  با فراهم آوردن حدود 8 میلیون تصویر برای بیش از 30هزار واژه تهیه شده است. سلسله مراتب ترادف‌های تصویرنت مبتنی بر سلسله مراتب ترادف‌های ImageNet بوده که با استفاده از معادل یابی خودکار در زبان فارسی معادل‎یابی شده‌اند. در این شبکه تصویری 7890745 تصویر (برای 32295 ترادف فارسی شده) با بهره‌گیری از بارگیری خودکار لینک های اصلی ارائه شده در ImageNet  فراهم گردیده اند. سپس 71873 تصویر با روش ‌‌جمع‌سپاری برای بیش از 1000 ترادف مخصوص فرهنگ ایرانی و اسلامی تهیه و به تصویرنت اضافه شده‌اند. هدف از این مقاله انتقال تجربیات، چالش‌های تولید و ابزارهای مورد نیاز حاصل از تولید پایگاه‌داده‌ی ‌‌سلسله‌مراتبی تصویرنت و همچنین تشریح فرآیند جمع‌سپاری صورت گرفته جهت تهیه تصاویر است.

کلیدواژه‌ها