PENANGANAN MISSING DATA DENGAN METODE IMPUTASI K-NEAREST NEIGHBOR DAN MUTUAL INFORMATION K-NEAREST NEIGHBOR
Permasalahan Survei Produktivitas Tanaman Pangan khususnya komoditi
ubi kayu di Provinsi Lampung adalah terjadinya non-observational. Non
observational dapat berupa non coverage dan non response. Non coverage yang
terjadi sudah tidak dapat diatasi namun nonrespon unit yang terjadi dapat
dikurangi dengan tetap melakukan pencacahan untuk item pertanyaan yang
menggunakan metode wawancara. Sedangkan untuk item pertanyaan dengan
observasi langsung akan missing karena datanya tidak dapat diperoleh (item
nonresponse). Item nonresponse dapat diatasi dengan metode imputasi. Metode
imputasi yang digunakan adalah K-Nearest Neighbor Imputation (KNNI) dan Mutual
Information K-Nearest Neighbor Imputation (MI-KNNI).
Data produktivitas ubi kayu merupakan data lengkap sehingga terlebih dahulu
dilakukan simulasi missing data sebanyak 1O,20,30,dan 40 persen dari total sampel
sehingga dapat dibandingkan performa kedua metode ini pada tiap simulasi data hilang.
Berdasarkan hasil pengolahan pada kedua metode bahwa semakin besar missing data
yang terjadi maka rata-rata nilai RMSE nya juga semakin besar. Artinya semakin banyak
data yang hilang maka tingkat akurasi kedua metode semakin berkurang. Rata-rata nilai
RMSE metode imputasi MI-KNN relatif lebih kecil daripada metode imputasi KNN,
artinya metode imputasi MI-KNN relatif lebih akurat dibandingkan dengan metode
imputasi KNN dengan k optimum dari masing-masing metode. Jika menggunakan k
optimum yang fixed dan sama antar kedua metode, diperoleh hasil bahwa metode
imputasi MI-KNN cenderung memiliki rata-rata nilai RMSE yang stabil dibandingkan
dengan metode imputasi KNN pada setiap perubahan nilai k optimum.
No copy data
No other version available