Apa yang dimaksud dengan Listwise deletion ?

analisis_data
missing_data

(Abila Rezfan Azkadina) #1

Listwise deletion

Listwise deletion merupakan metode untuk mengatasi data hilang dengan cara menghapus data yang hilang tersebut dari sampel. Kelebihan dari metode ini adalah dapat digunakan untuk setiap jenis analisis statistik dan tidak membutuhkan komputasi yang rumit. Namun kelemahannya adalah akan membuat kesimpulan menjadi tidak valid karena hanya sekedar menghapus data hilang yang ada.

Apa yang dimaksud dengan Listwise deletion ?


Apa yang dimaksud dengan data hilang atau missing data pada statistik ?
(Himawat Aryadita) #2

Listwise deletion merupakan sebuah metode dalam menangani data yang hilang atau missing data. Cara yang dilakukan dalam metode listwise deletion adalah dengan menghapus keseluruhan kasus data apabila terdapat data atau nilai yang hilang didalam variabel tersebut.

Sebagai contoh, apabila kita mempunyai data berikut ini,

No Umur Jenis Kelamin Pendapatan
1 23 Pria 1.000.000
2 34 Wanita 1.200.000
3 33 Pria 4.000.000
4 35 Wanita 3.000.000
5 35 Pria 2.400.000
6 Missing Pria 3.200.000
7 56 Missing 2.100.000
8 45 Pria Missing

Kita mempunyai 3 kasus data hilang, yaitu responden 6,7 dan 8. Apabila kita menggunakan pendekatan listwise deletion, maka kita menghapus secara keseluruhan data yang ada pada responden 6,7 dan 8 tersebut. Sehingga data yang kita analisis hanyalah data untuk responden 1 hingga 5.

Kapan kita menggunakan pendekatan listwise deletion ?

  • Ketika data yang kita ambil sepenuhnya adalah data yang Random atau Acak

    Hal ini dikarenakan, untuk data yang bersifat random, selama ukuran sampelnya mencukupi atau mewakili populasi, maka penghilangan data tidak akan mempengaruhi karakteristik dari populasi yang akan kita analisis.

  • Ketika kita mempunyai jumlah sampel yang banyak

    Misalnya kita mempunyai 500 sampel, dimana terdapat 25 sampel yang kehilangan data pada variabel yang diukur. Ketika kita membuang ke-25 missing data tersebut, maka sampel data kita menjadi 475 sampel, atau kehilangan sekitar 5 % data. Hal itu bukanlah hal yang buruk. Tetapi ketika kita kehilangan 10 % bahkan lebih sampel akibat missing data, maka hal tersebut bukanlah hal yang baik. Salah satu referensi menyarankan bahwa kita dapat menggunakan listwise deletion apabila missing data berjumlah 1 %.

Selain kedua kasus diatas, anda dapat menggunakan pendekatan yang lainnya apabila terdapat missing data pada sampel anda,misalnya dengan menggunakan pendekatan imputasi data atau algoritma EM.