PENDAHULUAN

Hello sobat pembaca setia WFH, kembali kami memberikan artikel menarik dan tentunya sangat bermanfaat bagi teman-teman yang saat ini sedang belajar Data Mining. Kali ini akan membahas mengenai salah satu tool yang terdapat dalam Data Mining  yang, yaitu Tanagra. Pada artikel kali ini akan membahas tuntas cara penggunaan aplikasi tanagra dan implemtasinya pada salah satu algoritma. Jadi, baca artikel ini sampai tuntas dan silahkan disimak dengan seksama.

Apa sih itu Tanagra? Jadi Tanagra merupakan salah satu software dalam data mining yang dibangun dengan tujuan untuk memberikan akses pada beberapa algoritma data mining (Julsam dkk, 2009). Aplikasi ini sangat mudah digunakan dan tentunya tidak mempersoalkan format bilangan dari file data set yang diimport, dan juga tidak berurusan dengan perbaikan data yang hilang.

Sebelum menggunakan aplikasi ini tentunya teman-teman harus menginstallnya terlebih dahulu. Aplikasi ini bisa download di https://tanagra.software.informer.com/ dengan V. 1.4.50. Lakukan penginstallan, maka akan muncul tampilan aplikasi Tanagra seperti gambar di bawah ini.

Tanagra memiliki User Interface yang sangat sederhana, sehingga sangat mudah di pahami dalam penggunaanya. Komponent-komponen yang disediakan mudah sangat mudah diakses yang dibagi menjadi bagian-bagian menu. Terdapat menu analysis pada kotak sebelah kiri sebagai proses pengolahan data menggunakan algoritma. Kemudian terdapat menu componens untuk memilih algoritma yang akan digunakan.

Import Data Menggunakan Aplikasi Tanagra

Cara menambahkan data set ke dalam tanagra dapat dilakukan langsung melalui aplikasi tanagra, pada menu bar aplikasi tanagra > Fille > New, maka akan muncul tampilan seperti di bawah ini:

Pada gambar di atas kita dapat menambahkan Dataset dengan beberapa format seperti

*.txt, *.arff, *.xls dan lainnya. Akan tetapi, pada artikel ini di contohkan cara meng-import data langsung melalui excel karena akan dilanjutkan penerapan menggunakan algoritma nantinya.

Penerapan Algoritma Apriori Pada Tanagra V.1.4.50

Artikel ini akan memberikan contoh penerapan salah satu algoritma Asoasi Rule yaitu Apriori. Apakah kamu tau algoritma apriori? Nah, a priori merupakan salah satu algoritma yang termasuk aturan asosiasi pada data mining. Analisis asosiasi atau association rule mining merupakan teknik dalam data mining untuk menemukan aturan asosiatif antara suatu kombinasi item (Kusrini & Luthfi, 2009).

Salah satu contoh dalam metode asosiasi adalah analisis pembelian barang di suatu toko swalayan yang dapat diketahui melalui berapa besar kemungkinan seorang pelanggan membeli roti dan lem secara bersamaan. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang rekomendasi produk kepada konsumen dengan adanya promosi dan diskon untuk kombinasi barang tertentu.

Dalam aturan asosiatif terdapat dua parameter yang perlu diperhatikan, yaitu support dan confidence. Support (nilai penunjangn) adalah persetase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar-item dalam aturan asosiasi.

Adapun rumus untuk mencari nilai support adalah melalui persamaan sebagai berikut: Nilai support untuk sebuah itemset

Setelah semua pola frekuensi tinggi ditemukan, kemudian dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A → B. Maka confidence dapat didapatkan melalui persamaan berikut.

Agara dapat mengetahui sebuah kekuatan aturan asosiatif, maka dapat diukur menggunakan lift ratio. Lift ratio sekaligus digunakan untuk menguji atau mengukur seberapa pentingnya aturan asosiatif. Nilai lift ratio dapata didapakan melalui persamaan berikut.

Adapun langkah-langkah Algoritma Apriori adalah sebagai berikut (Buulolo, 2020):

  1. Siapkan data bentuk format transaksi.
  2. Pembangunan itemset. Kandidat k-itemset dibangun dari kombinasi (k-1)- itemset yang diperoleh dari iterasi yang ada sebelumnya. Satu cara dari Algoritma Apriori adalah pemotongan kandidat k itemset yang subsetnya berisi k-1 item tidak terdapat dalam frequent itemset dengan panjang k-1.
  3. Penghitungan support dari tiap-tiap kandidat k-itemset. Support dari tiap kandidat k-itemset didapatkan dengan membaca atau scan database agar dapat untuk menghitung jumlah transaksi yang memuat semua item didalam kandidat k-itemset tersebut. Ini merupakan juga ciri dari Algoritma Apriori yang dimana diperlukan penghitungan dengan cara keseluruhan database sebanyak k-itemset terpanjang.
  4. Menetapkan Frequent itemset requent itemset yang memuat k item atau k-itemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dibandingkan minimum support.
  5. Bila tidak didapatkan pola bentuk frekuensi tinggi baru maka seluruh proses dihentikan.

Untuk pemahaman lebih lanjut mengenai Algoritma Apriori, teman-teman bisa mendowload tutorial lengkap penerapan Algoritma Apriori pada Aplikasi Tanagra pada link dibawah ini.

REFERENSI

[1]. Buulolo, E. (2020). Data Mining Untuk Perguruan Tinggi. Sleman: Deepublish.

[2]. Julsam, Mooduto, H. A., & Alexyusandria. (2009). Penambangan Data Format Text Excel Dengan Software Tanagra. Elektron, 1(1), 20–29.

[3]. Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta: C.V Andi Offset (Penerbit Andi).

Original Create by : Rimelda Adha

Sumber Gambar