Djuazva, Ichlas
(2023)
Perbandingan Metode Prediksi Galat dalam Pemodelan Klasifikasi dengan
Algoritma C4.5 untuk Data Seimbang.
Skripsi thesis, Fakultas Matematika dan Ilmu Pengetahuan Alam.
Abstract
Algoritma C4.5 merupakan salah satu algoritma pohon keputusan yang
bertujuan membangun model pohon keputusan yang dapat digunakan untuk
klasifikasi data. Algoritma C4.5 merupakan pengembangan dari Iterative
Dichotomiser 3 dengan peningkatan. Model yang dibentuk dengan algoritma perlu
diuji akurasinya untuk melihat kinerja dari modelnya. Akurasi model dapat dilihat
dengan melakukan prediksi nilai kesalahan atau prediksi galat.Metode prediksi
galatyang digunakan adalah metode Cross Validation (CV). CV membagi data
menjadi data training untuk membentuk model dan data testing untuk menguji model.
CV terdiri dari beberapa metode yaitu Leave One Out (LOO), Hold Out (HO), dan k-folds CV. Tujuan penelitian ini adalah untuk melihat metode prediksi galat mana
yang paling cocok digunakan pada algoritma C4.5.
Penelitian ini menggunakan data bangkitan yang berdistribusi normal dengan
tiga kasus data yaitu univariat, bivariat, dan multivariat dengan bebarapa kombinasi
perbedaan rataan dan korelasi. Korelasi ditambahkan untuk melihat pengaruh
terhadap prediksi galat yang dihasilkan. Pada kasus univariat menggunakan 2 struktur
rataan yang berbeda, bivariat menggunakan 4 struktur rataan dengan 3 struktur
korelasi yang berbeda, dan multivariat menggunakan 10 struktur rataan berbeda
dengan 5 struktur korelasi berbeda.
Pada kasus univariat, bivariat, dan multivariat, metode prediksi galat k-folds CV
merupakan metode prediksi galat yang paling cocok dalam melakukan prediksi laju
galat pada algoritma C4.5.
Actions (login required)
|
View Item |