PERBANDINGAN K-MEANS CLUSTERING, ADAPTIVE K-MEANS CLUSTERING DAN FUZZY K-MEANS CLUSTERING BERDASARKAN INTERNAL VALIDATION DAN EXTERNAL VALIDATION (Studi Kasus : Pengelompokkan Kabupaten/Kota di Jawa Barat Berdasarkan Indikator Kesejahteraan Rakyat)
K-Means merupakan salah satu metode pengelompokkan data
nonhirarki. Kelebihan dari metode ini adalah sederhana, mudah
diimplementasikanldijalankan dan juga mudah diadaptasi, namun metode ini juga
memiliki beberapa kelemahan antara lain mengharapkan pengguna untuk
menentukan banyak cluster terlebih dahulu dan juga sifat kaku (hard) yang
dimiliki. Untuk mengatasi kelemahan K-Means telah dikembangkan Adaptive K
Means Clustering dan Fuzzy K-Means Clustering. Adaptive K-Means
mengestimasi banyaknya cluster secara otomatis dan Fuzzy K-Means
mempertimbangkan tingkat keanggotaan himpunan fuzzy sebagai dasar
pembobotan sehingga memungkinkan suatu obyek menjadi anggota dari satu atau
lebih cluster.
Dengan bantuan program R diperoleh perbandingan antara K-Means,
Adaptive K-Means dan Fuzzy K-Means berdasarkan internal validation index dan
external validation index dengan menggunakan data simulasi 2dnormal,
ringnorm, shapes, smiley, cassini danfaithfulNdata dimana berdasarkan internal
validation index, K-Means lebih tepat digunakan untuk mengelompokkan data
simulasi ringnorm dan smiley, Fuzzy K-Means lebih tepat digunakan untuk
mengelompokkan data simulasi 2dnormal, K-Means Clustering dan Fuzzy K
Means Clustering sama-sama tepat digunakan untuk mengelompokkan data
simulasi shapes dan cassini, K-Means Clustering, Fuzzy K-Means Clustering dan
Adaptive K-Means Clustering sama-sama tidak tepat digunakan untuk
mengelompokkan data simulasi yang mengandung noise/outlier. Berdasarkan
external validation index, Fuzzy K-Means Clustering lebih tepat dalam
mengelompokkan data simulasi 2dnormal, ringnorm, shapes, smiley, dan cassini.
Sedangkan dalam mengelompokkan data simulasi faithfulNdata, Adaptive K
Means Clustering lebih tepat.
iv
v
Untuk data Indikator Kesejahteraan Rakyat tahun 2014 Provinsi J awa
Barat, dilakukan explorasi sehingga diketahui bahwa sebaran datanya mendekati
jenis data simulasi 2dnormal oleh karena itu dilakukan pengelompokkan terhadap
data riil tersebut menggunakan algoritma Fuzzy K-Means Clustering. Hasil
pengelompokkan menghasilkan enam cluster, kemudian dilakukan profiling
menghasilkan dua cluster dengan profil Kesejahteraan Baik, dua cluster dengan
profil Kesejahteraan Cukup Baik dan dua cluster dengan profil Kesejahteraan
Tidak Baik.
4. Abstract
K-Means is one method of grouping data nonhirarki. The advantage of this
method is simple, easy to implement / execute and is also easily adjusted, but this
method also has some disadvantages, among others expect the user to specify a
lot of clusters in advance and also the characteristics of rigid (hard) owned. To
overcome the disadvantages of K-Means has developed Adaptive K-Means
Clustering and Fuzzy K-Means Clustering. Adaptive K-Means estimate the
number of clusters automatically and Fuzzy K-Means considering the level set as
the basic weighted fuzzy membership so as to allow the object becomes a member
oJ one or more clusters.
With the help of the program R for comparison between K-Means,
Adaptive K-Means and Fuzzy K-Means based index of internal validation and
index external validation using simulated data 2dnormal, ringnorm, shape,
smiley, Cassini and faithfulNdata simulation data which is based on the index of
internal validation K -Means more appropriately used to classify smiley and
ringnorm, Fuzzy K-Means is more appropriate to classify Zdnormal, K-Means
Clustering and Fuzzy K-Means Clustering used to classify shapes and cassini, K
Means clustering, Fuzzy K-Means clustering and Adaptive K-Means clustering
together inappropriately used to classify simulation data containing noise /
outlier. Based indices external validation, Fuzzy K-Means Clustering is more
appropriate to classify simulated data Zdnormal, ringnorm, shape, smiley, and
Cassini. While simulated data faithfulNdatat, Adaptive K-Means Clustering is
more appropriate.
Welfare Indicators 2014 of West Java Province, exploration to determine
that the data distribution is closer to the type 2dnormal simulation data for the
grouping algorithms to real data using Fuzzy K-Means Clustering. Groupped
produce six cluster, then do profiling resulted in two cluster with the profile of
Prosperity "Good", two clusters with profiles "Good Enough" and two clusters
with profiles "Not Good".
No copy data
No other version available