PENDAHULUAN

K-means clustering adalah salah satu algoritma pengelompokan data dengan sistem partisi yang sangat popular dalam teknik data mining. K-means mempartisi data yang ada ke dalam bentuk satu atau lebih kelompok (cluster), sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Algortima ini melakukan proses pemodelan tanpa supervisi (unsupervised).

Weka adalah aplikasi data mining open source berbasis java. Aplikasi ini dikembangkan pertama kali oleh universitas Waiko di Selandia Baru sebelum menjadi bagian dari Pentaho. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi atau formulasi dari sekumpulan data sampling. Weka berisi peralatan seperti pre-processing, classification, regression, clustering, association rules dan visualization.

Oleh karena itu, pada tutorial ini akan membahas terkait panduan klasterisasi data dengan algoritma k-means menggunakan tools Weka. Without any further ado, let’s get started!

Langkah 1:

Sediakan data yang akan diolah berformat file CSV. Pada tutorial ini menggunakan dengan Data Nilai Siswa sebagai berikut.

Langkah 2 :

Buka aplikasi WEKA. Kemudian, klik “Explorer”.

Langkah 3:

Lalu, klik “Open file” untuk import data yang akan diolah.

Langkah 4:

Cari file yang akan diolah, kemudian klik ‘Open’.

Langkah 5:

Apabila terdapat atribut yang tidak digunakan dalam pengolahan data pada tools, maka klik atribut yang ingin di hapus, kemudian, klik ‘Remove’, untuk menghapus atribut tersebut.

Langkah 6:

Pilih menu ‘Cluster’, lalu klik ‘Choose’, setelah itu pilih ‘SimpleKMeans’, seperti gambar berikut.

Langkah 7:

Double Click pada bagian yang ditandai berikut. Kemudian akan muncul parameter dalam pengolahan kelompok data. Isi/Edit sesuai dengan kebutuhan. Pada tutorial ini dicontohkan menggunakan K=3. Setelah selesai, klik “Ok”.

Langkah 8:

Klik button ‘Start’, maka akan menghasilkan output seperti pada tampilan ‘Clusterer Output’ seperti gambar dibawah ini.

Langkah 9:

Kemudian, klik kanan pada ‘Result list’ yang ada, dan pilih ‘Visualize cluster assignments’.

Maka, berikut tampilan hasil cluster yang diperoleh. Lanjutkan dengan tahapan penyimpanan data dengan klik button ‘Save’. Kemudian, simpan di folder yang diinginkan dengan format file Arff. Pada tutorial ini, saya menyimpannya di Document dengan nama ‘Hasil Cluster’. Lalu, klik ‘Save’.

Langkah 10:

Kembali ketampilan pertama dari Weka. Kemudian pilih menu ‘Tools’, lalu klik ‘ArffViewer’.

Langkah 11:

Klik ‘File’ dan pilih ‘Open’ untuk membuka file Hasil Cluster yang telah disimpan berformat Arff tadi. Lalu, cari file tersebut dan klik ‘Open’ setelah menemukannya.

Kemudian, akan terbuka tampilan Hasil Cluster berikut.

Langkah 12:

Untuk menyimpannya agar bisa dibuka di Ms. Excel, klik ‘File’, kemudian klik ‘Save as’. Lalu, simpan di folder yang diingankan, dengan nama yang diingankan, dengan format CSV. Pada tutorial ini akan disimpan di Document, dengan nama Cluster Nilai Siswa. Setelah selesai, klik ‘Save’.

Langkah 13:

Berikut hasil klasterisasi data yang dilakukan pada tools Weka setelah diubah ke format file CSV.

Demikian tutorial klasterisasi data dengan algoritma k-means menggunakan tools Weka, mohon maaf atas segala kekurangan, terimakasih telah membaca, dan semoga  bermanfaat!

REFERENSI

[1]. https://www.youtube.com/watch?v=tQftGEq0TbA&t=135s diakses 08 Mei 2020

[2]. https://ilmukomputer.org/wp-content/uploads/2018/05/agus-k-means-

clustering.pdf diakses 22 April 2020

[3]. https://abdiansah.wordpress.com/2014/11/30/mengenal-weka/ diakses 08 Mei 2020

[4]. https://juniwaly.blogspot.com/2018/05/apa-bagaimana-weka-

digunakan.html?m=1 diakses 08 Mei 2020

Original Create by : Ega Kuslia Sari & Ulya Khairunnisa

Sumber Gambar