Perbandingan Metode Prediksi Galat dalam Pemodelan Regresi Logistik Biner untuk Data Tidak Seimbang (Imbalanced)

Sinaga, Bahri Annur (2023) Perbandingan Metode Prediksi Galat dalam Pemodelan Regresi Logistik Biner untuk Data Tidak Seimbang (Imbalanced). Skripsi thesis, Universitas Negeri Padang.

[img]
Preview
Text
B1_10_BAHRI_ANNUR_SINAGA_18337016_5270_2023.pdf

Download (3MB) | Preview

Abstract

Regresi logistik biner merupakan analisis regresi yang digunakan dalam pemodelan klasifikasi. Kinerja regresi logistik biner bisa dilihat dari tingkat akurasi model yang terbentuk. Akurasi dapat diukur dengan memprediksi galat. Salah satu metode prediksi galat yang sering digunakan adalah cross validation. Pada kenyataannya data riil yang ditemukan seringkali tidak seimbang. Data tidak seimbang merupakan data yang memiliki jumlah amatan kelas yang berbeda jauh. Dalam regresi logistik data tidak seimbang memberikan pengaruh terhadap hasil prediksi. Ketika data semakin tidak seimbang hasil prediksi akan mendekati jumlah kelas mayoritas. Penelitian ini berfokus melihat bagaimana perbandingan kinerja metode prediksi galat dalam pemodelan regresi logistik biner dengan data tidak seimbang. Terdapat tiga algoritma pada cross validation, yaitu leave one out, hold out, dan k-fold cross validation. Leave one out adalah metode yang membagi data berdasarkan jumlah amatan sehingga setiap amatan berkesempatan menjadi data training namun memerlukan waktu yang cukup lama dalam proses analisis ketika jumlah amatan besar. Hold out merupakan algoritma yang paling sederhana yang hanya membagi data menjadi dua bagian secara acak sehingga ada kemungkinan data yang penting tidak menjadi data training. K-fold cv adalah algoritma yang membagi data menjadi beberapa kelompok, namun k-fold cv tidak cocok digunakan pada data yang memiliki jumlah amatan yang kecil. Penelitian ini menggunakan data simulasi yang dibangkitkan dengan pengaturan yang berbeda-beda. Hasil yang diperoleh adalah algoritma k-fold cv merupakan algoritma prediksi galat yang paling cocok diterapakan pada regresi logistik biner dengan data tidak seimbang. Semakin tidak seimbang data hasil error rate mendekati kelas minoritas sehingga nilainya kecil.

Item Type: Thesis (Skripsi)
Contributors:
ContributionContributorsEmail
Thesis advisorVionanda, DodiUNSPECIFIED
CorrectorPermana, DonyUNSPECIFIED
CorrectorSalma, AdmiUNSPECIFIED
Uncontrolled Keywords: PERBANDINGAN METODE PREDIKSI GALAT
Subjects: Q Science > QA Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistik-S1
Depositing User: Arlianis
Date Deposited: 06 Nov 2023 03:03
Last Modified: 06 Nov 2023 03:03
URI: http://repository.unp.ac.id/id/eprint/48012

Actions (login required)

View Item View Item