Surabaya, Januari 2025 – Algoritma, mungkin istilah ini sudah tidak asing ya untuk kamu terutama bagi kamu yang seringkali berhubungan dengan analisa pola pembelian konsumen demi meningkatkan penjualan hingga tingkat kepuasan pelanggan. Lalu apakah kamu juga pernah mendengar tentang algoritma apriori?
Sebagaimana algoritma pada umumnya, algoritma apriori ini merupakan salah satu algoritma dalam bidang data mining yang digunakan untuk menemukan pola berasosiasi dalam dataset yang cukup besar. Algoritma ini terkenal karena kemampuannya dalam menemukan hubungan antar item dalam suatu transaksi, seperti yang sering dilakukan dalam analisis keranjang belanja atau dikenal dengan market basket analysis.
Secara sederhana, algoritma apriori diartikan sebagai algoritma berbasis aturan asosiasi yang bertujuan untuk menemukan pola atau hubungan antar-item dalam sebuah dataset. Algoritma ini diperkenalkan oleh Rakesh Agrawal dan Ramakrishnan Srikant pada tahun 1994 dan banyak digunakan untuk menganalisis pola transaksi. Algoritma apriori bekerja dengan prinsip frequent itemset (item set yang sering muncul) dan support threshold, yaitu batas minimum yang menentukan apakah suatu kombinasi item cukup sering muncul untuk dianggap sebagai pola yang signifikan.
Cara Kerja Algoritma Apriori
Lalu bagaimana algoritma apriori ini bekerja? Ada tiga tahapan utama di antaranya:
1. Menghitung Frekuensi Itemset Tunggal
Algoritma menghitung frekuensi setiap item dalam dataset.
Item yang tidak memenuhi batas support threshold dihilangkan.
2. Menggabungkan Itemset untuk Membentuk Kombinasi Baru
Setelah itemset tunggal dihitung, algoritma menggabungkan item yang memenuhi syarat untuk membentuk kombinasi itemset baru (itemset dengan lebih dari satu item).
Proses ini dikenal dengan istilah candidate generation.
3. Mengevaluasi Kombinasi Itemset
Kombinasi itemset yang baru diuji dengan menghitung nilai support (frekuensi kemunculan dalam dataset).
Itemset yang memenuhi support threshold disimpan sebagai frequent itemset.
Proses ini diulang hingga tidak ada lagi kombinasi itemset baru yang memenuhi support threshold.
Kelebihan Algoritma Apriori
1. Mudah Dipahami dan Diimplementasikan
Apriori menggunakan pendekatan iteratif yang sederhana sehingga mudah dipahami oleh pemula.
2. Efektif untuk Dataset Kecil hingga Sedang
Algoritma ini cocok untuk dataset yang tidak terlalu besar, di mana kombinasi item tidak terlalu kompleks.
3. Dapat Menemukan Pola Berharga
Pola-pola yang ditemukan dapat membantu pengambilan keputusan bisnis, seperti dalam pengaturan produk di toko atau penawaran promosi.
Kekurangan Algoritma Apriori
1. Kinerja Lambat pada Dataset Besar
Algoritma ini memerlukan waktu pemrosesan yang lama pada dataset besar karena banyaknya kombinasi item yang harus dihitung.
2. Konsumsi Memori Tinggi
Proses candidate generation membutuhkan memori yang besar untuk menyimpan semua kombinasi item.
3. Terbatas pada Data Transaksional
Apriori lebih cocok untuk data dengan struktur transaksional dan kurang optimal untuk data yang lebih kompleks atau tidak terstruktur.
Contoh Kasus Penggunaan Algoritma Apriori
Market Basket Analysis
Sebuah supermarket ingin mengetahui pola pembelian produk oleh pelanggannya. Dataset berisi transaksi seperti berikut:
Transaksi
Item yang Dibeli
T1
Roti, Mentega, Susu
T2
Roti, Mentega
T3
Susu, Keju
T4
Roti, Susu
T5
Mentega, Susu, Keju
Langkah 1: Menghitung Frekuensi Item Tunggal
Roti: 3
Mentega: 3
Susu: 4
Keju: 2
Dengan support threshold 2, semua item lolos ke tahap berikutnya.
Langkah 2: Membuat Kombinasi Itemset Baru
Kombinasi dua item:
Roti & Mentega: 2
Roti & Susu: 2
Mentega & Susu: 3
Mentega & Keju: 2
Kombinasi dengan frekuensi ≥ 2 dilanjutkan.
Langkah 3: Membuat Aturan Asosiasi
Dari kombinasi di atas, ditemukan aturan seperti berikut:
Jika membeli Mentega, kemungkinan besar juga membeli Susu (tingkat confidence tinggi).
Dengan informasi ini, supermarket dapat menempatkan produk-produk tersebut berdekatan atau memberikan diskon kombinasi untuk meningkatkan penjualan.
Dapat disimpulkan bahwa algoritma Apriori adalah metode yang efektif untuk menemukan pola tersembunyi dalam dataset transaksional. Meski memiliki keterbatasan pada dataset yang sangat besar, algoritma ini tetap menjadi pilihan utama untuk analisis asosiasi. Dengan memahami cara kerja, kelebihan dan kekurangannya dari algoritma ini, kamu dapat memanfaatkan algoritma ini secara optimal untuk mendukung berbagai kebutuhan analisis data.
Penulis: Fujiyama / Foto: Pexels