Perbandingan Metode Prediksi Laju Galat dalam Pemodelan Classification and Regression Tree untuk Kasus Data Tidak Seimbang

Zullani, Lifia (2024) Perbandingan Metode Prediksi Laju Galat dalam Pemodelan Classification and Regression Tree untuk Kasus Data Tidak Seimbang. Skripsi thesis, Universitas Negeri Padang.

[img]
Preview
Text
B1_10_LIFIA_ZULLANI_18337053_3770_2024.pdf

Download (1MB) | Preview

Abstract

CART adalah salah satu algoritma klasifikasi berbasis pohon. Pohon CART terdiri dari simpul akar, simpul internal, dan simpul terminal. Akurasi model dalam CART dapat dihitung dengan mengukur kesalahan prediksi dalam model. Salah satu metode yang digunakan untuk memprediksi laju galat adalah cross validation. Terdapat tiga algoritma cross validation, yaitu leave one out, hold out, dan k-fold cross validation. Metode-metode ini memiliki kinerja yang berbeda dalam membagi data menjadi data pelatihan dan pengujian, sehingga terdapat kelebihan dan kekurangan pada setiap metode. Hold out tidak dapat menjamin bahwa himpunan pelatihan mewakili seluruh dataset, leave one out memerlukan perhitungan yang signifikan dan k-fold cross validation memerlukan waktu komputasi lebih lama. Dalam kenyataannya, data seringkali tidak seimbang. Data yang tidak seimbang merujuk pada data dengan jumlah observasi yang berbeda di setiap kelas. Dalam CART, data tidak seimbang mempengaruhi hasil prediksi. Model CART menghasilkan pohon keputusan yang lebih cenderung memprediksi kelas mayoritas. Hal ini dapat mengurangi akurasi prediksi untuk kelas minoritas. Oleh karena itu, pemilihan metode cross validation yang sesuai sangat penting untuk memastikan bahwa cross validation mempertahankan proporsi kelas yang benar selama evaluasi model. Penelitian ini berfokus pada perbandingan metode prediksi laju galat dalam model CART dengan data tidak seimbang. Penelitian ini menggunakan data simulasi bangkitan dengan pengaturan yang berbeda-beda. Hasil yang diperoleh menunjukkan bahwa di antara ketiga metode cross validation, metode yang memiliki variasi error rate paling rendah adalah metode k-fold cross validation. Oleh karena itu, k-fold cross validation menjadi metode yang paling sesuai memprediksi laju galat pada CART dengan data tidak seimbang.

Item Type: Thesis (Skripsi)
Contributors:
ContributionContributorsEmail
Thesis advisorVionanda, DodiUNSPECIFIED
CorrectorSyafriandi, SyafriandiUNSPECIFIED
CorrectorFitria, DinaUNSPECIFIED
Uncontrolled Keywords: METODE PREDIKSI LAJU GALAT
Subjects: Q Science > QA Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistik-S1
Depositing User: Arlianis
Date Deposited: 17 Sep 2024 08:11
Last Modified: 17 Sep 2024 08:11
URI: http://repository.unp.ac.id/id/eprint/54031

Actions (login required)

View Item View Item