Penerapan Model Decision Tree pada Machine Learning untuk Memprediksi Calon Potensial Mahasiswa Baru
Abstract
Pada penelitian sebelumnya, Implementation of Nae Bayes Classifier-based Machine
Learning to Predict and Classify New Students at Matana University memiliki akurasi sebesar
0,73 atau 73%. Ini belum maksimal, akurasinya perlu ditingkatkan. Pada penelitian ini, untuk
meningkatkan akurasi dengan penggunaan model yang berbeda, yaitu model Decision Tree.
Alasan memilih Decision Tree adalah prediktor yang digunakan tidak banyak (empat prediktor)
dan dapat digunakan untuk klasifikasi atau prediksi. Empat prediktor tersebut, yaitu frekuensi,
lokasi, jurusan siswa di SMA/K, dan program studi yang diminati. Targetnya adalah status masuk
dari calon mahasiswa. Metode penelitian yang dilakukan yaitu pengumpulan data, prapemrosesan,
proses machine learning dengan model Decision Tree dan visualisasi hasil. Bahasa
pemrograman yang digunakan adalah Python. Hasil dari Decision Tree ini memperlihatkan
perubahan, melalui sepuluh kali eksekusi diperoleh rata rata akurasi rasio data latih dan data uji,
70:30 sebesar 0,727 atau 72,7% (akurasi terendah 47% dan tertinggi 87%), untuk rasio 80:20
sebesar 0,73 atau 73% (akurasi terendah 60% dan tertinggi 90%). Dengan demikian, hasil dari
model Decision Tree ini secara rata rata belum melampaui hasil dari model Nae Bayes
Classifier. Penelitian lebih lanjut, meningkatkan jumlah dan variasi data,memperkecil selisih hasil
setiap kali model dieksekusi, mencoba model lain, dan mengembangkan aplikasi siap pakai.