Sinaga, Bahri Annur
(2023)
Perbandingan Metode Prediksi Galat dalam Pemodelan Regresi Logistik
Biner untuk Data Tidak Seimbang (Imbalanced).
Skripsi thesis, Universitas Negeri Padang.
Abstract
Regresi logistik biner merupakan analisis regresi yang digunakan dalam
pemodelan klasifikasi. Kinerja regresi logistik biner bisa dilihat dari tingkat akurasi
model yang terbentuk. Akurasi dapat diukur dengan memprediksi galat. Salah satu
metode prediksi galat yang sering digunakan adalah cross validation. Pada
kenyataannya data riil yang ditemukan seringkali tidak seimbang. Data tidak
seimbang merupakan data yang memiliki jumlah amatan kelas yang berbeda jauh.
Dalam regresi logistik data tidak seimbang memberikan pengaruh terhadap hasil
prediksi. Ketika data semakin tidak seimbang hasil prediksi akan mendekati jumlah
kelas mayoritas. Penelitian ini berfokus melihat bagaimana perbandingan kinerja
metode prediksi galat dalam pemodelan regresi logistik biner dengan data tidak
seimbang.
Terdapat tiga algoritma pada cross validation, yaitu leave one out, hold out,
dan k-fold cross validation. Leave one out adalah metode yang membagi data
berdasarkan jumlah amatan sehingga setiap amatan berkesempatan menjadi data
training namun memerlukan waktu yang cukup lama dalam proses analisis ketika
jumlah amatan besar. Hold out merupakan algoritma yang paling sederhana yang
hanya membagi data menjadi dua bagian secara acak sehingga ada kemungkinan
data yang penting tidak menjadi data training. K-fold cv adalah algoritma yang
membagi data menjadi beberapa kelompok, namun k-fold cv tidak cocok digunakan
pada data yang memiliki jumlah amatan yang kecil. Penelitian ini menggunakan
data simulasi yang dibangkitkan dengan pengaturan yang berbeda-beda.
Hasil yang diperoleh adalah algoritma k-fold cv merupakan algoritma
prediksi galat yang paling cocok diterapakan pada regresi logistik biner dengan data
tidak seimbang. Semakin tidak seimbang data hasil error rate mendekati kelas
minoritas sehingga nilainya kecil.
Actions (login required)
|
View Item |