Author: Insanul Kamila, Ulya Khairunnisa, Mustakim

Publish: Jurnal Ilmiah Rekayasa dan Manajemen Sistem Informasi

Abstract:

Data mining merupakan pemprosesan sebuah informasi dari suatu database yang dapat digunakan untuk berbagai kebutuhan sektor swasta. Salah satu metode dalam data mining, yaitu Clustering yang bertujuan untuk menemukan pengelompokan dari serangkaian pola, titik, objek maupun dokumen. Algoritma K-Means clustering merupakan algoritma yang berperan penting dalam bidang data mining serta sederhana untuk diimplementasikan dan dijalankan. Selain itu, terdapat pengembangan varian dari metode K-Means Clustering yaitu K-Medoids yang muncul sebagai penanggulangan kelemahan Algoritma K-Means yang sensitif terhadap outlier dikarenakan sebuah objek dengan sebuah nilai yang besar mungkin secara substansial menyimpang dari distribusi data. Penelitian ini membandingkan kedua algoritma pada suatu dataset. Adapun data yang digunakan merupakan data transaksi bongkar muat selama tahun 2017 pada PT Pelabuhan Indonesia I Cabang Dumai berdasarkan atribut agen, keterangan barang, jenis, dan jumlah ton. Dari percobaan yang dilakukan, diperoleh hasil pengolahan K-Means hanya membutuhkan waktu rata-rata 1 detik sedangkan pengolahan data pada K-Medoids membutuhkan waktu rata-rata 1 menit 38 detik pada RapidMiner. Nilai DBI pada K-Means lebih rendah dibandingkan K-Medoids yaitu masing-masing 0.112 dan 0.119. Perolehan cluster dominan, menunjukkan bahwa agen Buana Listya Tama TBK, PT mendominasi diikuti agen Samudera Sarana Karunia, PT.

Conclusion:

Perbandingan antar kedua algoritma clustering, K-Medoids dan K-Means tidak menunjukkan perbedaan yang signifikan mengenai pengelompokkan data. Adapun dalam pengolahannya, K-Means hanya membutuhkan waktu rata-rata 1 detik sedangkan pengolahan data pada K-Medoids membutuhkan waktu rata-rata 1 menit 38 detik yang artinya apabila makin tinggi iterasi dan pengelompokkan yang ditentukan, maka pengolahan data akan semakin lama. Selanjutnya pada nilai Davies-Bouldin Index diperoleh nilai k=3 pada K-Means lebih rendah dibandingkan K-Medoids. Selain itu, pengolahan data berlanjut pada k=10 juga menunjukkan nilai DBI pada K-Means lebih rendah. Pola pengelompokkan masing-masing cluster diperoleh berdasarkan pembagian jenis barang sesuai jenis bongkar atau muat barang. Perolehan cluster dominan, menunjukkan bahwa agen Buana Listya Tama TBK, PT mendominasi diikuti dengan agen Samudera Sarana Karunia, PT. sebagai agen yang melakukan transaksi terbanyak.

Sumber Gambar