حذف افزونگی داده‌های خام از مجموعه داده‌ها، با استفاده از تحلیل مؤلفه‌های اصلی ‌تُنُک

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد مخابرات، دانشکده مهندسی برق، دانشگاه شهید بهشتی

2 آزمایشگاه پردازش سیگنال های دیجیتال، دانشکده مهندسی برق، دانشگاه شهید بهشتی

چکیده

تحلیل مؤلفه‌های اصلی یکی از روش‌های مطرح به منظور کـاهش ابعـاد مجموعـه داده است که برای داده‌های یک بُعدی و دوبُعدی قابل استفاده است. با توجه به تُنُـک نبـودن بردارهای پایه‌، تحلیل مؤلفه‌های اصـلی تُنُک مطرح گردیده است که با حفظ خواص تحلیل مؤلفـه‌هـای اصـلی اسـتاندارد، بعضی از درایه‌های بردارهای پایه را صفر می‌کند. در این مقاله، با توجه به خاصیت تُنُکی بردارهای پایه، که سبب بی تأثیر گشتن بعضی از مقادیر مجموعه داده در انتقال به فضای جدید می گردد، دو آلگوریتم به منظور حذف افزونگی از داده‌های خام، در حالت یک بُعدی و دوبُعدی ارائه شده‌است. در الگوریتم یک بُعدی، افزونگی بین درایه های سیگنال تشخیص و سپس از تمامی مشاهدات مجموعه حذف می‌شوند. در الگوریتم دوبُعدی اهمیت سطر وستون‌های تصاویر مجموعه داده، تشخیص و سطر وستون‌های با اهمیت کمتر به طور مستقیم از داده‌های خام حذف می‌شوند. یکی از مهمترین مزیت آلگوریتم های پیشنهادی که به عنوان روش های نمونه برداری غیریکنواخت نیز میتوانند خوانده شوند، حفظ ظاهر سیگنال ها می باشد. پس از حذف افزونگی داده‌های خام توسط دو الگوریتم ارائه شده، می‌توان از داده‌های جدید با ابعاد کمتر در کاربردهای دیگری همچون بازشناسی مجموعه داده، فشرده سازی و ... استفاده کرد

کلیدواژه‌ها