Optimalisasi prediksi penyakit stroke pada data tidak seimbang menggunakan teknik SMOTE-Tomek

Main Article Content

Eka Herdit Juningsih
Kartika Handayani
Erni Erni
Dinar Ismunandar

Abstract

Stroke merupakan salah satu penyakit yang berdampak besar terhadap kesehatan masyarakat, karena dapat menyebabkan kematian maupun kecacatan permanen. Oleh karena itu, identifikasi dini terhadap risiko stroke menjadi sangat penting dalam upaya pencegahan. Penelitian ini dilakukan untuk membandingkan kinerja tiga algoritma klasifikasi, yaitu Naive Bayes, K-Nearest Neighbors (KNN), dan Decision Tree, dalam memprediksi kejadian stroke berdasarkan data rekam medis pasien. Dataset yang digunakan terdiri dari 5.110 entri dengan sejumlah fitur seperti usia, jenis kelamin, tekanan darah, kadar glukosa, dan status merokok. Teknik SMOTE-Tomek diterapkan untuk menyeimbangkan jumlah antara data pasien stroke dan non-stroke. Selanjutnya, model dievaluasi menggunakan pengujian validasi silang lima lipatan dan diukur menggunakan akurasi, precision, recall, serta f1-score. Hasil pengujian menunjukkan bahwa model Decision Tree memberikan performa terbaik dengan nilai f1-score yang paling tinggi yakni 91%, setelah penyeimbangan data dilakukan. Berdasarkan hasil pengujian, algoritma Decision Tree menunjukkan performa terbaik dengan nilai f1-score sebesar 91% setelah penyeimbangan data menggunakan SMOTE-Tomek. Hal ini membuktikan bahwa kombinasi teknik balancing SMOTE-Tomek dan pemilihan algoritma klasifikasi yang sesuai sangat efektif dalam meningkatkan akurasi prediksi resiko stroke pada data tidak seimbang.

Article Details

Section

Articles

How to Cite

Optimalisasi prediksi penyakit stroke pada data tidak seimbang menggunakan teknik SMOTE-Tomek. (2025). Hexatech: Jurnal Ilmiah Teknik, 4(2). https://doi.org/10.55904/hexatech.v4i2.1571