Perbandingan Performa CNN dan LSTM untuk Klasifikasi Sentimen Multibahasa pada Review Aplikasi Facebook
Abstract
Pesatnya pertumbuhan pengguna media sosial, khususnya Facebook, menghasilkan volume ulasan aplikasi yang sangat besar dan multibahasa, sehingga menimbulkan tantangan tersendiri dalam analisis sentimen, terutama akibat fenomena code-mixing dan keragaman linguistik. Sebagian besar pendekatan analisis sentimen yang ada masih bersifat monolingual, sehingga kurang efektif dalam menangani data lintas bahasa. Oleh karena itu, penelitian ini bertujuan untuk mengevaluasi dan membandingkan performa algoritma Convolutional Neural Network (CNN) dan Long Short-Term Memory (LSTM) dalam melakukan klasifikasi sentimen multibahasa pada ulasan aplikasi Facebook. Penelitian ini menggunakan pendekatan kuantitatif eksperimental dengan total 9.600 ulasan aplikasi yang dikumpulkan dari Google Play Store, mencakup bahasa Indonesia, Inggris, dan Melayu, serta diklasifikasikan ke dalam tiga kelas sentimen, yaitu positif, negatif, dan netral. Representasi teks dilakukan menggunakan Language-Agnostic BERT Sentence Embedding (LaBSE) untuk menangani variasi bahasa tanpa proses penerjemahan. Model CNN dirancang untuk mengekstraksi fitur lokal melalui filter konvolusi, sedangkan model LSTM memanfaatkan mekanisme sekuensial untuk memahami konteks kalimat. Evaluasi performa dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil eksperimen menunjukkan bahwa model CNN memberikan performa terbaik dengan akurasi pengujian sebesar 91,18% dan nilai F1-score sebesar 0,91, sementara model LSTM mencapai akurasi sebesar 79,51% dengan F1-score sebesar 0,79. Meskipun kedua model mampu menangani data multibahasa secara umum, performa klasifikasi pada ulasan berbahasa Inggris dan sentimen netral masih menjadi tantangan utama akibat kompleksitas linguistik dan penggunaan bahasa informal. Secara keseluruhan, penelitian ini menunjukkan bahwa kombinasi embedding multibahasa dan arsitektur CNN lebih efektif untuk klasifikasi sentimen multibahasa pada domain ulasan media sosial

