PENDAHULUAN

Pada tutorial ini akan membahas bagaimana cara penggolahan data dengan algoritma apriori dengan tools rapid miner, sebelum masuk ke pembahasan inti kita akan membahas terlebih dahulu apa itu algoritma apriori dan apa itu tools rapid miner.

Apa itu algoritma apriori? Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis atau market basket analysis. Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan suatu kombinasi item. Tujuan dari algoritma apriopri yaitu untuk menentukan frequent itemsets yang dijalankan pada beberapa atau sekumpulan data serta mencari pola yang sering muncul pada setiap transaksi. Sedeangkan rapid miner merupakan software tool open source untuk data Mining. Rapid miner dioperasikan pada sebuah lingkungan untuk machine learning, data mining, text mining dan predictive analytics.

Sebelum masuk ke tahap penggolahan data, yang harus disiapkan adalah
• Data yang akan di olah
• Tools rapid miner

Untuk pengolahan data dengan algoritma apriori langkah pertama yang harus dilakukan adalah penetuan atribut, atribut yang di gunakan atau yang akan di pilih harus ada hubungan dan kaitan satu sama lain. Pada tutorial kali ini data yang akan digunakan adalah data penjualan pada sebuah toko furniture dan elektornik dengan 346 record dan 16 atribut tapi yang akan digunakan hanya 3 atribut saja.

Setelah penentuan atribut dilakukan, langkah selanjutnya yaitu tahap preprocessing data, pada tahap ini akan dilakukan beberapa hal, yaitu cleaning data dan transformas data.

Pada tahap cleaning dilakukan pembersihan data transaksi penjualan furniture dan elektronik. Tahap cleaning ini dilakukan dengan cara membuang data yang kosong atau data yang tidak sempurna kemudian membuang field-field yang tidak dibutuhkan agar tidak memperlambat dalam proses asosiasi dana mempercepat mendapatkan hasil pola gabungan.

Tahap selanjutnya adalah transformasi data, tahap ini akan dilakukan agar mempermudah saat memasukkan data ke dalam tools rapid miner dengan membuat inisial atau symbol symbol untuk data.
Seperti contoh berikut:

Tabel Inisial item pembelian data transaksi penjualan

No.Items Pembelian
1MC1 (mesin cuci 1 Tempat)
2MC2 (mesin cuci 2 Tempat)
3SP (speaker aktif)
4RP (rak piring)
5PFK (palung fadhil kaca)
6LED24 (TV uk.24 dengan semua merk)
7LED 32 (TV uk.32 dengan semua merk)
8LED 43 (TV uk.43 dengan semua merk)
9PR (parabola)
10DG (digital)
11LP2 (lemari pakaian 2 pintu)
12LP3 (lemari pakaian 3 pintu)
13LH (lemari hias)
14LM (lemari mini)
15MB (meja belajar)
16KR (kursi)

Setelah dilakukan transformasi data, tahap selanjutnya adalah melakukan tranformasi data penjualan kedalam bentuk tabular. Berikut merupakan hasil transformasi data ke dalam bentuk tabular dapat dilihat pada Tabel:

Tabel Tabular atribut item pembelian data transaksi penjualan

camMC1MC2RPPFKLED24LED32………JM
C1000000………0
C2000000………0
C3100000………0
C4010000………0
C5000000………0
C6000000………0
C7000000………0
…….….….….….….….….….
C346000010………0

Keterangan :
a) Customers merupakan nomor faktur setiap pembeli
b) MC1, MC2, RP, PFK, LED24 Dll merupakan barang-barang atau produk yang dijual oleh PT.Citra Mustika Pandawa cabang Kerinci.
c) 0 merupakan tanda bahwa barang tersebut tiak dibeli oleh pembeli
d) 1 merupakan tanda bahwa barang tersebut dibeli oleh pembeli

Setelah melalui tahap preprocessing dan transformasi data, selanjutnya adalah tahap asosiasi dengan menggunakan algoritma apriori untuk menentukan pola pembelian pelanggan. Hasil ini diukur dengan menggunakan nilai Support dan Confidence. Percobaan perhitungan ini menggunakan tools Rapid Miner dengan 346 record data. Dalam tahap imlementasi dengan rapidminer ini ada 3 operator yang digunakan dalam tools, yaitu: Read Exel, Numeric to Binominal dan W-Apriori. Operator pertama adalah Read Exel, operator ini berfungsi untuk tempat data dan akan diinputkan data yang sudah diolah. Karena data yang diolah berupa exel maka operator yang digunakan adalah read Exel. Operator kedua adalah Numeric to Binominal, operator ini berfungsi untuk merubah data yang tadinya numeric menjadi nominal dua nilai pada operator read Exel karena semua atribut dari masukan wajib merupakan bilangan binominal yaitu nilai true/false. Operator ketiga adalah W-Apriori, operator ini berfungsi untuk perhitungan algoritma apriori. Desain dari ketiga operator ini dapat dilihat pada gambar berikut:

Setelah ketiga operator terhubung dan dijalankan maka akan keluar hasil untuk item yang sering muncul dan saling berhubungan, pada data penjualan elektronik dan furniture ini hasil yang didapat nilai minimal support 4% dan minimal confidance 90%. Hasil yang diperoleh dari rapidminer ada 2 rule yaitu:

  1. Jika membeli parabola maka akan membeli digital
  2. Jika membeli LED32 dan parabola maka akan memebeli digital

Demikian tutorial pengolahan data dengan algoritma apriori dengan tools rapidminer yang sangat sederhana ini, mohon maaf apabila banyak terdapat kesalahan, terima kasih.

REFERENSI
[1]. https://www.researchgate.net/publication/336422159_Penerapan_Algoritma_Apriori_Terhadap_Data_Penjualan_Di_Swalayan_Koperasi_Bappenas_Jakarta_Pusat diakses 2 september 2019
[2]. https://ejurnal.stmik-budidarma.ac.id/index.php/mib/article/view/1496fdi akses 25 april 2020

Original Create by: Nurfadila Utami

Sumber Gambar