Seleksi fitur merupakan bagian penting untuk mengoptimalkan kinerja dari metode klasifikasi. Tujuan utama dari seleksi fitur adalah mengurangi kompleksitas, meningkatkan akurasi dan memilih fitur optimal dari suatu kumpulan fitur data. Algoritma seleksi fitur dapat dibedakan menjadi dua tipe, yaitu filter dan wrapper. Filter menggunakan karakteristik umum bekerja secara terpisah dari algoritma pembelajaran. Di sisi lain, wrapper mengevaluasi fitur dan memilih atribut berdasatkan perkiraan akurasi menggunakan model pembelajaran tertentu dan algoritma pencarian. Metode filter dilakukan dengan menyaring atribut relevan menggunakan formula khusus. Berbagai macam penelitian feature selection menggunakan metode filtering, misalnya correlation based feature selection (CFS).

Korelasi Pearson merupakan salah satu ukuran korelasi yang digunakan untuk mengukur kekuatan dan arah hubungan linier dari dua veriabel. Dua variabel dikatakan berkorelasi apabila perubahan salah satu variabel disertai dengan perubahan variabel lainnya, baik dalam arah yang sama ataupun arah yang sebaliknya. Nilai yang dihasilkan pada Pearson’s terletak pada [-1;1], untuk nilai -1 yang berarti korelasi negatif sempurna (karena satu variabel meningkat, yang lainnya menurun), +1 berarti korelasi positif sempurna dan 0 yang berarti tidak ada korelasi linier antara kedua variabel tersebut. Lalu, bagaimana penerapannya dalam tools Python? Berikut beberapa langkah yang dapat anda perhatikan untuk mendapatkan nilai korelasi antar atribut.

  • Persiapkan dataset yang anda miliki, kemudian bukalah jupyter notebook untuk memulai eksekusi.
  • Import dataset yang akan dieksekusi dalam bentuk excel.
  • Setelah membersihkan dataset, anda dapat menuliskan fungsi berikut pada input untuk melihat nilai korelasi berbentuk diagram batang.
  • sehingga didapatkan tampilan berikut:
  • Untuk melihat hasil nilai korelasi dapat dilihat sebagai berikut:

Setelah mendapatkan nilai korelasi tersebut, anda dapat menetapkan ambang nilai yang anda inginkan untuk menentukan berapa atribut yang akan anda gunakan pada tahap selanjutnya.

Selamat Mencoba, Semoga Bermanfaat! 🙂

REFERENSI

[1].http://ciputrauceo.net/blog/2016/5/16/pengertian-korelasi-dan-macam-macam-korelasi, diakses pada 16 Mei 2016

[2].https://docplayer.info/34923237-Korelasi-pearson-pendahuluan.html

[3].https://www.researchgate.net/publication/327822068_Analisis_Sentimen_Opini_Film_Menggunakan_Metode_Naive_Bayes_dengan_Ensemble_Feature_dan_Seleksi_Fitur_Pearson_Correlation_Coefficient, diakses pada Desember 2018

[4].https://ejournal.bsi.ac.id/ejurnal/index.php/Bianglala/article/view/535/427

[5]. http://jurnal.iaii.or.id/index.php/RESTI/article/view/1189

Original Create By : Insanul Kamila & Nurhalimah

Sumber Gambar