Fuzzy C-Means Clustering dengan analisis robust
Clustering Analysis (analisis pengelompokan) merupakan salah satu teknik
multivariat yang bertujuan untuk menggabungkan unit-unit observasi ke dalam
cluster berdasarkan variabel yang digunakan untuk pengelompokan. C-means
clustering adalah salah satu metode pengelompokan nonhierarki yang paling
banyak digunakan. Kelemahan c-means jika sifat pengelompokan sulit untuk
dideskripsikan secara pasti. Dalam prakteknya kondisi ketidakpastian lebih sering
ditemui dalam mengklasifikasikan suatu kondisi. Karena itu kemudian
berkembang metode fuzzy clustering yang didasari oleh teori himpunan fuzzy
(kabur, tidak pasti), dimana salah satunya adalah fuzzy c-means (FCM).
Keberadaan noise dan data pencilan sering menyebabkan hasil analisis yang
kurang menggambarkan kondisi sebenarnya, karena taksiran pusat cluster
menjadi semakin jauh dari niIai sesungguhnya. SaIah satu faktor yang berperan
penting terhadap keefektifan FCM adalah pangkat penimbang m. Nilai m
optimum turut mempengaruhi ketahanan FCM terhadap noise dan penciIan.
Dalam anaIisis robust, untuk melihat pengaruh dari penambahan observasi
individual dapat digunakan 'kurva pengaruh' Influence Curve (lC) atau disebut
juga fungsi pengaruh. HasiI peneIitian menunjukkan niIai m yang terlalu besar
menyebabkan pengeIompokan kurang menggarnbarkan kondisi yang sebenarnya,
tapi pada tingkat tertentu (nilai m optimum) dapat menunjukkan robustness dari
FCM.
No copy data
No other version available