Prediksi Risiko Kardiovaskular Berdasarkan Faktor Gaya Hidup Menggunakan Algoritma Random Forest
Keywords:
gaya hidup , imbalanced handling, prediksi, random forest, risiko kardiovaskularAbstract
Penyakit kardiovaskular merupakan penyebab utama kematian secara global yang sangat dipengaruhi oleh faktor gaya hidup yang dapat dimodifikasi. Penelitian ini bertujuan untuk mengembangkan model prediksi risiko penyakit kardiovaskular yang objektif dengan memanfaatkan algoritma Random Forest berdasarkan data gaya hidup dan kesehatan. Metode penelitian mengikuti kerangka kerja CRISP-DM yang meliputi tahap prapemrosesan data seperti label encoding, standardisasi menggunakan StandardScaler, dan penanganan ketidakseimbangan data menggunakan teknik Synthetic Minority Over-sampling Technique (SMOTE). Model dikembangkan menggunakan mekanisme Bootstrap Aggregating dan dioptimasi melalui Grid Search CrossValidation. Hasil eksperimen menunjukkan bahwa model Random Forest mampu mencapai akurasi sebesar 83,40% dengan nilai precision sebesar 0,93 pada kelas berisiko. Analisis tingkat kepentingan fitur mengungkapkan bahwa asupan air harian, detak jantung istirahat, dan tekanan darah merupakan prediktor yang paling signifikan dalam menentukan risiko kesehatan individu. Penelitian ini menyimpulkan bahwa model tersebut berpotensi menjadi instrumen deteksi dini guna mendukung intervensi kesehatan yang lebih cepat.