Deteksi Dini Penyakit Kanker Paru-Paru Menggunakan Perbandingan Algoritma Xgboost Dan Decision Tree
Abstract
Kanker paru-paru merupakan salah satu penyebab utama kematian tertinggi di seluruh dunia,
sehingga penting melakukan deteksi dini untuk meningkatkan kemungkinan sembuh bagi
pasien. Namun, proses deteksi seringkali terhambat oleh berbagai faktor, termasuk kurangnya
tenaga medis, ketepatan diagnosis, serta rendahnya kesadaran masyarakat yang seringkali
menunda pemeriksaan atau merasa takut untuk konsultasi ke dokter saat munculnya gejala awal.
Penelitian ini bertujuan untuk menciptakan model klasifikasi berbasis data mining yang dapat
membantu dalam mendeteksi kanker paru-paru lebih awal. Algoritma yang digunakan adalah
Decision Tree dan XGBoost, didukung oleh metode SMOTE untuk mengatasi
ketidakseimbangan kelas dalam data. Dataset yang dianalisis diperoleh dari website kaggle dengan
berbagai atribut klinis dan gaya hidup pasien. Model yang dikembangkan yaitu model dengan
akurasi dan AUC yang tertinggi mencapai 93.89% dan 0.972 yaitu algoritma XGBoost. Hasil ini
menunjukkan algoritma XGBoost dapat memberikan kinerja yang lebih baik dalam mendeteksi
kanker paru-paru secara dini. Penelitian ini menunjukkan bahwa usia adalah faktor yang paling
berpengaruh dalam mendeteksi kanker paru-paru. Selain itu, gejala mengi (wheezing) dan tekanan
sosial (peer pressure) juga berkontribusi pada penyakit kanker paru- paru.
Kata kunci : Kanker paru-paru, Deteksi Dini, Decision Tree, XGBoost, SMOTE

