Analisis Sentimen Data Twitter Calon Presiden 2024 Mengunakan Algoritma Naïve Bayes Classifier dengan Metode K-Fold Cross Validation

Prajela, Aldi (2024) Analisis Sentimen Data Twitter Calon Presiden 2024 Mengunakan Algoritma Naïve Bayes Classifier dengan Metode K-Fold Cross Validation. Skripsi thesis, Universitas Negeri Padang.

[img]
Preview
Text
B1_10_ALDI_PRAJELA_19337038_1449_2023.pdf

Download (1MB) | Preview

Abstract

Pemilihan Presiden 2024 adalah sebuah proses memilih Presiden Republik Indonesia masa bakti 2024–2029. Pemilihan ini merupakan pilpres yang ke-8 di Indonesia. Menjelang dimulainya Pilpres, calon presiden menjadi perbincangan yang sering dibicarakan sehari-hari. Opini-opini positif dan negatif yang disampaikan oleh masyarakat pada media sosial twittermengenai Pilpres dan masing-masing calonnya sering menjadi trending, hal ini menandakan bahwa banyak masyarakat Indonesia yang menyuarakan opininya di twitter. Analisis yang digunakan untuk menyerap tweet tersebut menjadi sebuah informasi adalah analisis sentimen. Metode yang digunakan dalam pengklasifikasian sentimen yaitu Naïve Bayes Classifier dengan metode K-Fold Cross Validation untuk mendapatkan hasil akurasi yang terbaik. Sebelum melakukan tahap pemodelan, tweet dikumpulkan melalui teknik crawling dan melalui tahapan seperti text preprocessing, pelabelan berbasis lexicon based, serta pembobotan data. Model yang dihasilkan dievaluasi menggunakan confusion matrix. Hasil penelitian menunjukan bahwa hasil klasifikasi NBC terhadap sentimen masyarakat kepada masing-masing Capres yaitu, Anies mendapatkan 83% tweet positif dan 17% tweet negatif dari 2148 tweet, Prabowo Subianto mendapatkan 77% tweet positif dan 23% tweet negatif dari 1870 tweet, sedangkan Ganjar Pranowo mendapatkan 74% tweet positif dan 26% tweet negatif dari 1557 tweet. Setelah dilakukan confusion matrix untuk setiap keyword maka didapatkan hasil untuk keyword Anies memiliki nilai tertinggi pada iteration ke-6 yaitu nilai accuracy sebesar 80%, dan nilai recall sebesar 95%. Selanjutnya Prabowo memiliki nilai tertinggi pada iteration ke-10 yaitu nilai accuracy sebesar 80%, dan nilai recall sebesar 90%. Sedangkan Ganjar memiliki nilai tertinggi pada iteration 8 yaitu accuracy sebesar 85%, dan nilai recall sebesar 94%.

Item Type: Thesis (Skripsi)
Contributors:
ContributionContributorsEmail
Thesis advisorSuherman, SuhermanUNSPECIFIED
CorrectorAhmad, FauzanUNSPECIFIED
CorrectorRani, Maulani MeutiaUNSPECIFIED
Uncontrolled Keywords: ANALISIS SENTIMEN, CALON PRESIDEN, K-FOLD, NAÏVE BAYES
Subjects: H Social Sciences > HA Statistics
Q Science > Q Science (General)
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistik-S1
Depositing User: Fitri Yelli
Date Deposited: 14 Aug 2024 08:59
Last Modified: 14 Aug 2024 08:59
URI: http://repository.unp.ac.id/id/eprint/53319

Actions (login required)

View Item View Item