Pembuatan Data Sintetis Untuk Software Quality Assurance (QA) Menggunakan Generative AI Large Language Model

  • Alim Purnomo Aji Surya M.R Universitas Djuanda
  • Hilmy Aliy Andra Putra Universitas Djuanda
  • Gugun Gunadi Universitas Djuanda
Keywords: Data Sintetis, Generative AI, Large Language Model, Quality Assurance

Abstract

Pengujian perangkat lunak (Software Quality Assurance/QA) modern dalam ekosistem pengembangan yang tangkas (Agile) membutuhkan volume data uji yang masif, dinamis, dan representatif. Namun, pemanfaatan data produksi riil secara langsung menghadapi rintangan operasional dan kendala regulasi privasi yang ketat, seperti Undang-Undang Pelindungan Data Pribadi (UU PDP) Nomor 27 Tahun 2022. Teknik anonimisasi konvensional terbukti tidak memadai karena seringkali merusak integritas relasional statistik, sementara model generatif Deep Learning tradisional seperti Generative Adversarial Networks (GANs) rentan terhadap anomali mode collapse pada data kategorikal berdimensi tinggi serta menuntut biaya komputasi yang mahal. Penelitian ini mengusulkan kerangka kerja komputasi inovatif menggunakan pendekatan zero-shot inference berbasis Large Language Model (LLM), secara spesifik menggunakan arsitektur Gemini 3, untuk membangkitkan data uji sintetis berformat tabular murni tanpa melalui proses pelatihan ulang (fine-tuning). Evaluasi kinerja dilakukan pada 1.000 baris kerangka data uji demografi dan finansial (berdasar parameter dataset Glassdoor Gender Pay Gap). Analisis fidelitas data diukur menggunakan metrik analitik Cosine Similarity, Jensen-Shannon (JS) Divergence, dan uji jarak Kolmogorov-Smirnov (KS). Hasil eksperimen menunjukkan performa presisi tingkat tinggi: LLM mereplikasi distribusi data kategorikal dengan rata-rata kemiripan Cosine mencapai 99,38% (mengeliminasi halusinasi leksikon) dan stabilitas proporsi populasi JS-Divergence sebesar 96,52%. Pada dimensi numerikal kontinu, model mempertahankan kepatuhan batas logis (boundary constraints) dengan tingkat akurasi jarak KS rata-rata sebesar 89,88%. Pendekatan ini berhasil mendobrak batasan model terdahulu, menghadirkan terobosan solusi pengadaan data uji industri yang efisien secara biaya, berskala besar, seketika (real-time API), dan menjamin 100% kepatuhan privasi data.

Published
2026-03-31
How to Cite
Surya M.R, A. P. A., Putra, H. A. A., & Gunadi, G. (2026). Pembuatan Data Sintetis Untuk Software Quality Assurance (QA) Menggunakan Generative AI Large Language Model. IKRA-ITH Informatika : Jurnal Komputer Dan Informatika, 10(1), 430-436. Retrieved from https://journals.upi-yai.ac.id/index.php/ikraith-informatika/article/view/6521