: Penanganan Data Hilang Biner dengan Regression Imputation dan Stochastic Regression Imputation dalam Pemodelan Regresi Logistik (Studi Kasus pada Data Hasil Kehamilan Ibu di Propinsi Jawa Barat)
Dalam analisis data, seringkali ditemukan unit-unit dalam data yang
dianalisis mengandung data hilang. Adanya data hilang ini dapat menyebabkan
penaksiran parameter menjadi bias dan tidak efisien. Berbagai metode telah
dikembangkanuntuk menangani data hilang, salah satunya adalah metode
imputasi, yaitu mengisi data hilang dengan sebuah nilai tertentu. Metode imputasi
yang paling sering digunakan adalah imputasi rata-rata, imputasi regresi, hot-deck
imputation dan multiple imputation. Semua metode tersebut merupakan metode
yang biasanya digunakan untuk mengatasi data hilang pada variabel kontinu,
untuk penanganan data hilang pada variabel biner tentunya berbeda. Meskipun
demikian beberapa metode imputasi dapat diadaptasi untuk menangani data hilang
pada variabel biner. Pada penelitian kali ini, akan dilakukan imputasi untuk data
hilang pada variabel biner dengan menggunakan regression imputation dan
stochastic regression imputation.
Dalam penelitian ini, kedua metode tersebut dilakukan studi simulasi
untuk melihat karakteristik dan kinerja keduanya. Selain itu kedua metode
tersebut juga diterapkan pada data hasil survei RAND Labor and Population
tahun 2007 mengenai hasil kehamilan ibu. Hasil simulasi menunjukkan bahwa
penanganan data hilang dengan menggunakan metode stochastic regression
imputation menunjukkan kinerja yang lebih baik dibandingkan metode regression
imputation. Kedua metode imputasi tersebut juga diaplikasikan pada data hasil
kehamilan ibu. Selanjutnya data hilang yang telah diimputasi dengan metode
listwise deletion, stochastic regression imputation dan regression imputation,
dianalisis menggunakan regresi logistik ordinal yang hasilnya menunjukkan
bahwa metode listwise memberikan nilai standard error paling besar. Sedangkan
stochastic regression imputation dan metode regression imputation memberikan
hasil yang relatif hampir sama
No copy data
No other version available