1
دانشجوی کارشناسی ارشد بخش مهندسی کامپیوتر دانشگاه شهید باهنر کرمان
2
دانشکده فنی و مهندسی دانشگاه شهید باهنر کرمان
چکیده
وجود مجموعه دادههای تصویری نقش اساسی در زمینه تشخیص نویسه خوان نوری (OCR) و بازیابی اسناد دارد. علیرغم اینکه تا به امروز مجموعه دادههای تصویری زیادی با اشیا متفاوت در حوزه درک و ناحیهبندی اسناد غیرفارسی منتشر شده است، رسم الخط فارسی از این پیشرفت عقب مانده است و تاکنون در زمینه درک و ناحیهبندی اسناد فارسی، مجموعه دادگانی با دسترسی عمومی ارائه نشده است. از سوی دیگر، اگرچه زبانهای فارسی و عربی شباهتهای زیادی دارند، اما تفاوت بین ساختار این دو زبان باعث میشود که سیستمهای آموزشدیدهOCR با مجموعه داده عربی، دقت مناسبی روی تصاویر اسناد فارسی نداشته باشند. در این مقاله، یک مجموعه داده برای تصاویر اسناد فارسی معرفی میگردد که مشتمل بر 5598 تصویر است. تصاویر تهیه شده متعلق به روزنامهها، کتابهای درسی، مقالات علمی، فایلهای PDF فارسی، پایاننامهها، انواع لوگو ایرانی، کتب دستنوشته قدیمی و جزوات تایپ شده و دستنویس ریاضی هستند. در مجموعه داده معرفی شده، اشیا درون تصاویر به 6 گروه پاراگراف (متن)، شکل، جدول، لوگو، رابطه ریاضی و سرصفحه دستهبندی و برچسبگذاری شدهاند. برای ارزیابی کارایی مجموعه تصویر پیشنهادی، سه روش شناخته شده مبتنی بر یادگیری عمیق پیاده سازی و نتایج بر مبنای معیارهای مختلف گزارش شده است.
فرجی, امین, سعید, مسعود, & نظام آبادی پور, حسین. (1402). معرفی یک مجموعه داده برای کاربرد های درک و ناحیه بندی تصاویر اسناد فارسی. مجله بینایی ماشین و پردازش تصویر, 10(2), 31-46.
MLA
امین فرجی; مسعود سعید; حسین نظام آبادی پور. "معرفی یک مجموعه داده برای کاربرد های درک و ناحیه بندی تصاویر اسناد فارسی". مجله بینایی ماشین و پردازش تصویر, 10, 2, 1402, 31-46.
HARVARD
فرجی, امین, سعید, مسعود, نظام آبادی پور, حسین. (1402). 'معرفی یک مجموعه داده برای کاربرد های درک و ناحیه بندی تصاویر اسناد فارسی', مجله بینایی ماشین و پردازش تصویر, 10(2), pp. 31-46.
VANCOUVER
فرجی, امین, سعید, مسعود, نظام آبادی پور, حسین. معرفی یک مجموعه داده برای کاربرد های درک و ناحیه بندی تصاویر اسناد فارسی. مجله بینایی ماشین و پردازش تصویر, 1402; 10(2): 31-46.