PENGARUH DATA PREPROCESSING TERHADAP PERFORMA REGRESI LINIER DALAM PREDIKSI SAHAM

  • Aji Pangestu Universitas Esa Unggul
  • Raden Teddy Iswahyudi Universitas Esa Unggul

Abstrak

Penelitian ini membahas implementasi data preprocessing untuk meningkatkan performa model
regresi linier dalam prediksi harga saham, dengan studi kasus pada saham 2012.TW periode Januari–
Juni 2023. Data preprocessingmenjadi tahap penting karena data finansial sering mengandung missing
values, outlier, dan distribusi yang tidak seimbang. Tahapan preprocessing meliputi data cleaning,
deteksi dan penanganan outlier, feature engineering, seleksi fitur, serta normalisasi. Model regresi
linier kemudian dilatih dan diuji menggunakan time series split dengan evaluasi metrik R², MSE, dan
MAPE. Hasil analisis menunjukkan bahwa regresi linier memiliki keterbatasan dalam menangkap
dinamika harian (R² = 0,39), namun memberikan hasil yang lebih baik pada data mingguan (R² = 0,62)
dan sangat kuat pada data bulanan (R² = 0,95). Nilai MSE yang relatif rendah pada ketiga skala data
menunjukkan prediksi model cukup akurat terhadap tren harga. Dengan demikian, preprocessing
berkontribusi signifikan terhadap peningkatan performa regresi linier, meskipun kompleksitas pasar
saham menuntut pengembangan model yang lebih adaptif. Penelitian ini memberikan gambaran bahwa
regresi linier dapat dijadikan baseline prediksi harga saham jangka pendek, serta membuka peluang
integrasi dengan model pembelajaran mesin yang lebih canggih

Diterbitkan
2025-07-30