آنالیز خوشه ای

مقدمه

          تحلیل خوشه ای روشی است آماری که مجموعه ای از افراد را بر حسب اندازه

همانندی میان آنها خوشه میکند. بنابر این هر خوشه گروهی است که افراد تشکیل

دهنده آن بیشترین همانندی را با یکدیگر دارند. تحلیل خوشه ای میتواند به طریق

پایگانی (hierarchical) یا ناپایگانی (non hierarchical) انجام پذیرد. در روش پایگانی در

طی فرایند خوشه بندی نخست خوشه ها شناسائی و سپس بر حسب درجه همانندی

در یکدیگر ادغام میشوند تا سر انجام همه خوشه ها در یک خوشه جمع شوند.  روش

چند میانگین (K-mean) متداولترین روش خوشه بندی ناپایگانی است. در این روش

نخست افراد به k گروه دلخواه تقسیم شده و سپس هر فرد در گروهی خوشه میشود که

کمترین فاصله را تا میانگین آن گروه دارد.

          فرایند تحلیل خوشه ای میتواند از نوع شکافتی یا از نوع پیوندی باشد. در نوع

شکافتی نخست همه افراد در یک خوشه جا داده میشوند و سپس افرا چنان به دو

خوشه متمایز تجزیه میشوند که تفاوت میان آنها بیشینه شود و این فرایند تا آنجا ادامه

که به تعداد افراد خوشه داشته باشیم. در نوع پیوندی نخست فرض میکنیم هر فرد یک

خوشه است و با یافتن همانندترین زوج ها افراد خوشه بندی میشوند. سپس

همانندترین خوشه ها در یکدیگر ادغام میشوند و این فرایند آنقدر ادامه مییابد تا همه

خوشه ها در یک خوشه جمع شوند.

          ممکن است همانندی افراد بر حسب یک صفت اندازه گیری شود که در این

صورت خوشه بندی را تک صفتی مینامیم. اگر همانندی بر حسب چند صفت اندازه گیری

شود خوشه بندی چند صفتی نامیده میشود. اندازه گیری همانندی پایه اصلی هر

تحلیل خوشه ای است. روشهای گوناگونی برای اندازه گیری همانندی پیشنهاد شده

است که هریک بسته به ماهیت موضوع مورد بررسی کارایی پیدا میکنند. یک شاخص

همانندی مناسب فاصله میان افراد را از حیث صفت یا صفات مورد بررسی می سنجد.

اهداف طبقه بندی

1.ساده سازی و رفع مشکلات موجود در فهم و استنتاج صحیح _مختصرسازی داده ها

تعیین الگوهای موجود بین داده ها.

پیش بینی درصورت خلاصه سازی به گونه ای که بتوان روابط مشخصی بین داده ها

تشخیص داد.

/ 1 نظر / 17 بازدید
hossein

حضور هيئت هاي مذهبي در ميدان امام حسين تا آزادي براي مقابله با اغتشاشگران