K-means clustering adalah salah satu algoritma pengelompokan data dengan sistem partisi yang sangat popular dalam teknik data mining. K-means mempartisi data yang ada ke dalam bentuk satu atau lebih kelompok (cluster), sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Algoritma ini melakukan proses pemodelan tanpa supervisi (unsupervised).

RapidMiner adalah salah satu software atau tools untuk pengolahan data mining. Tugas yang dilakukan oleh RapidMiner adalah berkisar dengan analisis teks, mengekstrak pola-pola dari data set yang besar dan mengkombinasikannya dengan metode statistika, kecerdasan buatan, dan database. Tujuan dari analisis teks ini adalah untuk mendapatkan informasi bermutu tertinggi dari teks yang diolah.

Oleh karena itu, tutorial kali ini akan membahas terkait panduan klasterisasi data dengan algoritma k-means menggunakan tools RapidMiner. Without any further do, let’s get started!

Langkah 1: Sediakan data yang akan diolah berformat file Excel. Pada tutorial ini akan mencontohkan dengan Data Nilai sebagai berikut.

Langkah 2:
Buka aplikasi RapidMiner. Dilanjutkan dengan import data yang akan diolah, yaitu dengan klik button “Add Data” yang terdapat dalam panel Repository.

Langkah 3:
Terdapat dua pilihan pencarian tempat penyimanan data yang akan di-add ke dalam tools, pada tutorial ini data tersimpan pada My Computer, maka lanjutkan dengan klik button “My Computer”.

Langkah 4:
Lanjutkan mencari lokasi penyimpanan file data. Apabila sudah ditemukan, maka klik button “Next”.

Langkah 5:
Pilih cells yang akan di-import-kan, lalu klik button “Next”.

Langkah 6:
Masih dalam proses import data, yaitu pada tahap “format your columns”. Pada tutorial ini akan menggunakan tipe data integer, dan pada tahap ini merupakan preview/gambaran akhir data yang akan di-import kedalam tools. Kemudian, klik button “Next”.

Langkah 7:
Kemudian pada tutorial ini, data akan tersimpan di Local Repository dengan nama Data Nilai, dan klik “Finish”.

Langkah 8:
Data berhasil di-import ke dalam tools, dan siap untuk diolah. Lalu, kembali ke tampilan awal tadi, dengan klik button “Design”.

Langkah 9:
Setelah data berhasil di-import, maka klik data tersebut kemudian tarik ke panel process, seperti gambar berikut.

Langkah 10:
Selanjutnya, cari algortima k-means pada panel Operator, dengan mengetikkan “k-means”. Setelah ditemukannya algoritma k-means, lalu klik algoritma tersebut dan tarik ke panel prosess, seperti gambar berikut.

Langkah 11:
Lalu, koneksikan Retrieve Data dan Clustering, sebagai berikut.

Langkah 12:
Kemudian, klik Clustering yang ada di panel Process, lalu akan muncul Parameters Clustering (K-Means). Di dalam parameters tersebut terdapat k, dimana k merupakan jumlah cluster yang akan dibentuk. Pada tutorial ini menggunakan k = 4 (4 cluster). Setelah itu, klik button Run Process Locally dengan simbol segitiga seperti yang ditunjukkan pada gambar dibawah ini, untuk mulai memproses klasterisasi data.

Setelah data selesai dan berhasil diproses, maka diperolehlah hasil klasterisasi data. Hasil klaster juga dapat menunjukkan charts penyebaran cluster, cluster model maupun Centroid Table (Mean). Yuk cek tahapan lengkapnya disini, Download Full Penerapan Algoritma K-Means Menggunakan Tools RapidMiner

REFERENSI

[1]. https://www.youtube.com/watch?v=61ws_a6QMBc&t=21s diakses 22 April 2020

[2]. https://ilmukomputer.org/wp-content/uploads/2018/05/agus-k-meansclustering.pdf diakses 22 April 2020

[3]. http://student.blog.dinus.ac.id/maulino/2018/12/21/clustering-dengan-algoritmak-means-di-rapidminer/ diakses 22 April 2020

[4]. https://www.softovator.com/eksplorasi-data-mining-menggunakan-rapidminer/ diakses 22 April 2020

Original Create by : Ulya Khairunnisa & Siti Sarah

Sumber Gambar