بازشناسی کلمات دست نوشته با ویژگی های نوین و کاهش فرهنگ لغت

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد مهندسی کامپیوتر، گرایش علوم تصمیم و مهندسی دانش، دانشگاه آزاد اسلامی واحد مبارکه

2 دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور

چکیده

بازشناسی کلمات دست‌نوشته و تبدیل آن به متن تایپی معادل می‌ تواند در تفسیر دست‌نوشته و جستجو در اسناد بسیار حائز اهمیت باشد. در این مقاله سیستمی به منظور تشخیص برون‌ خط دست‌ نوشته فارسی در یک فرهنگ لغت محدود معرفی شده است. به منظور استخراج ویژگی، بعد از بلوک ‌بندی تصویر ورودی و استخراج مرکز هر بلوک توسط مرکز ثقل، میانگین مرکز اجزای متصل از الگوریتم سیفت متراکم استفاده شده است. از روش آنالیز تفکیک‌ کننده خطی برای کاهش تعداد ویژگی‌ ها استفاده شده است. در این مقاله، در مرحله نخست کلمات موجود در فرهنگ لغت بر اساس شباهت با استفاده از الگوریتم ISOCLUSE به همراه الگوریتم سلسله ‌مراتبی خوشه ‌بندی شده است. میانگین هر خوشه در فضای ویژگی به عنوان نماینده آن خوشه و مدخل مشترک اعضای آن خوشه در فرهنگ لغت تصویری، در نظر گرفته شده است. در مرحله دوم به منظور بازشناسی کلمه ‌ی جدید  از کلمات کاندید، از روش ماشین ‌بردار ‌پشتیبان به صورت چندکلاسه و دو‌کلاسه استفاده شده است. نتایج بدست آمده نشان دهنده عملکرد بهتر روش ماشین‌ بردار ‌پشتیبان دو‌کلاسه از لحاظ سرعت و دقت بر روی مجموعه داده ایران‌شهر می‌ باشد. در مرحله بازشناسی با انتخاب 5 خوشه نزدیک به کلمه دست‌نوشته مورد آزمون با دقت 93.37% حدود 76.65% از کلمات مورد بررسی کاهش خواهد یافت.

کلیدواژه‌ها