Apa saja kelebihan dan kekurangan metode Naive Bayes?

Naive Bayes

Dalam pemrogramman terdapat banyak algoritma, salah satunya yaitu algoritma Naive Bayes yang digunakan sebagai metode klasifikasi. Apa saja kelebihan dan kekurangan metode Naive Bayes?

Naive bayesian klasifikasi adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). Dalam hal ini, diasumsikan bahwa kehadiran atau ketiadaan dari suatu kejadian tertentu dari suatu kelompok tidak berhubungan dengan kehadiran atau ketiadaan dari kejadian lainnya.

Naive Bayesian dapat digunakan untuk berbagai macam keperluan antara lain untuk klasifikasi dokumen, deteksi spam atau filtering spam, dan masalah klasifikasi lainnya. Dalam hal ini lebih disorot mengenai penggunaan teorema Naive Bayesian untuk spam filtering

Teorema Naive Bayesian memiliki beberapa kelebihan dan kekurangan yaitu sebagai berikut :

Kelebihan Naive Bayesian :

  1. Menangani kuantitatif dan data diskrit
  2. Kokoh untuk titik noise yang diisolasi, misalkan titik yang dirata – ratakan ketika mengestimasi peluang bersyarat data.
  3. Hanya memerlukan sejumlah kecil data pelatihan untuk mengestimasi parameter (rata – rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi.
  4. Menangani nilai yang hilang dengan mengabaikan instansi selama perhitungan estimasi peluang
  5. Cepat dan efisiensi ruang
  6. Kokoh terhadap atribut yang tidak relevan

Kekurangan Naive Bayesian :

  1. Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka probabilitas prediksi akan bernilai nol juga
  2. Mengasumsikan variabel bebas

Sumber :

Naïve Bayes merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas. Konsep dasar yang digunakan oleh Naïve bayes adalah Teorema Bayes, yaitu teorema dalam statistika untuk menghitung peluang, Bayes Optimal Classifier menghitung peluang dari satu kelas dari masing-masing kelompok atribut yang ada, dan menentukan kelas mana yang paling optimal.

Kelebihan

Kelebihan dari penggunaan Naïve Bayes classifier dalam klasifikasi dokumen dapat ditinjau dari prosesnya yang mengambil aksi berdasarkan data-data yang telah ada sebelumnya. Oleh karena itu, klasifikasi dokumen dengan metode ini dapat dipersonalisasi, maksudnya adalah proses klasifikasi dokumen dapat disesuaikan sesuai dengan sifat dan kebutuhan masing-masing orang. Keuntungan ini secara nyata diperlihatkan dalam contoh spam filtering yang telah dicontohkan sebelumnya. Pernyataan suatu surat elektronik adalah spam atau tidak berbeda-beda bergantung pada subyek pembacanya yang berbeda-beda. Suatu surat elektronik yang diklasifikasikan spam oleh satu orang mungkin diklasifikasikan bukan spam oleh orang lain, dan begitu pula sebaliknya. Dengan klasifikasi cara Naïve Bayes classifier, pengklasifikasian spam otomatis ini dapat disesuaikan dengan masing-masing orang sehingga meminimalisasi aksi salah pengklasifikasian secara personal.

Kekurangan

Kekurangan dari metoda Naïve Bayes classifier ini adalah banyaknya celah untuk mengurangi keefektifan
metoda ini dan akibatnya meloloskan dokumen ke dalam kelas tertentu padahal jelas-jelas dokumen tersebut tidak layak berada di kelas tersebut. Dalam kasus spam filtering, kelemahan ini banyak digunakan oleh spammers berpengalaman untuk meloloskan spam ke dalam kelas bukan spam (menganggap surat elektronik bukan spam padahal sebenarnya adalah spam : Galat tipe II). Banyak cara yang dapat dilakukan, misalnya dengan memasukkan kata-kata yang asing dituliskan sehingga perangkat lunak tidak dapat melakukan pengecekan, atau dengan memasukkan banyak kata yang sebenarnya sering digunakan oleh surat elektronik non-spam agar pengguna secara manual mendeteksi sebagai spam dan untuk selanjutnya perangkat lunak akan mendeteksi surat elektronik dengan kata-kata non-spam tersebut sebagai spam serta memperkecil nilai probabilitas kata-kata spam (memanfaatkan false positive/galat tipe I). Cara lain adalah dengan memanfaatkan media gambar untuk menyampaikan spam. Hal ini didasarkan kepada metoda Naïve Bayes classifier yang dirancang hanya untuk mendeteksi kata-kata dan bukan gambar. Akibatnya, perangkat lunak tidak mampu untuk menganalisis gambar dan akhirnya mengklasifikasikan spam tersebut ke dalam kelas bukan spam.


Referensi:
http://informatika.stei.itb.ac.id/~rinaldi.munir/Probstat/2010-2011/Makalah2010/MakalahProbstat2010-017.pdf

Teorema Bayes dikemukakan oleh seorang pendeta presbyterian Inggris pada tahun 1763 yang bernama Thomas Bayes. Teorema Bayes digunakan untuk menghitung probabilitas terjadinya suatu peristiwa berdasarkan pengaruh yang didapat dari hasil observasi.

Teori probabilitas Bayesian merupakan satu dari cabang teori statistik matematik yang memungkinkan kita untuk membuat satu model ketidakpastian dari suatu kejadian yang terjadi dengan menggabungkan pengetahuan umum dengan fakta dari hasil pengamatan.

Kelebihan
Teori Bayesian menurut Grainner (1998), mempunyai beberapa kelebihan, yaitu:

  1. Mudah untuk dipahami.
  2. Hanya memerlukan pengkodean yang sederhana.
  3. Lebih cepat dalam penghitungan.
  4. Menangani kuantitatif dan data diskrit.
  5. Kokoh untuk titik noise yang diisolasi, misalkan titik yang dirata – ratakan ketika mengestimasi peluang bersyarat data.
  6. Hanya memerlukan sejumlah kecil data pelatihan untuk mengestimasi parameter (rata – rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi.
  7. Menangani nilai yang hilang dengan mengabaikan instansi selama perhitungan estimasi peluang
  8. Cepat dan efisiensi ruang
  9. Kokoh terhadap atribut yang tidak relevan

Kekurangan

Kekurangan dari Teori probabilitas Bayesian yang banyak dikritisi oleh para ilmuwan adalah karena pada teori ini, satu probabilitas saja tidak bisa mengukur seberapa dalam tingkat keakuratannya. Dengan kata lain, kurang bukti untuk membuktikan kebenaran jawaban yang dihasilkan dari teori ini.

Teorema Bayes menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syarat peristiwa B telah terjadi dan probabilitas terjadinya peristiwa B dengan syarat peristiwa A telah terjadi. Teorema ini didasarkan pada prinsip bahwa tambahan informasi dapat memperbaiki probabilitas. Teorema Bayes ini bermanfaat untuk mengubah atau memutakhirkan (meng-update) probabilitas yang dihitung dengan tersedianya data dan informasi tambahan.

Sesuai dengan probabilitas subyektif, bila seseorang mengamati kejadian B dan mempunyai keyakinan bahwa ada kemungkinan B akan muncul, maka probabilitas B disebut probabilitas prior. Setelah ada informasi tambahan bahwa misalnya kejadian A telah muncul, mungkin akan terjadi perubahan terhadap perkiraan semula mengenai kemungkinan B untuk muncul. Probabilitas untuk B sekarang adalah probabilitas bersyarat akibat A dan disebut sebagai probabilitas posterior. Teorema Bayes merupakan mekanisme untuk memperbaharui probabilitas dari prior menjadi probabilitas posterior. Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka probabilitas prediksi akan bernilai nol juga, Mengasumsikan variabel bebas.

Sumber: