Analisis Pengelompokan Faktor Risiko Diabetes Berdasarkan Indikator Kesehatan Menggunakan K-Means Clustering

Authors

  • Mildayanti Mildayanti Universitas Muslim Indonesia Author
  • Nova Febryna. A Universitas Muslim Indonesia Author
  • Sahra Zhafirah Universitas Muslim Indonesia Author

Keywords:

clustering data medis, diabetes melitus, indikator kesehatan, k-means clustering, pengelompokan diabetes

Abstract

Penelitian ini bertujuan untuk menganalisis pengelompokan faktor risiko diabetes melitus berdasarkan indikator kesehatan menggunakan metode K-Means Clustering. Data yang digunakan merupakan data sekunder dari platform Kaggle yang terdiri dari 768 data pasien dengan beberapa indikator klinis, antara lain kadar glukosa darah, tekanan darah, insulin, indeks massa tubuh, riwayat keluarga diabetes, dan usia. Tahapan penelitian meliputi preprocessing data yang mencakup penanganan nilai tidak valid, imputasi data hilang menggunakan median, penanganan outlier dengan metode Interquartile Range, serta normalisasi data menggunakan StandardScaler. Proses clustering dilakukan dengan algoritma K-Means dengan jumlah cluster optimal sebanyak tiga yang ditentukan menggunakan Elbow Method, dan kualitas pengelompokan dievaluasi menggunakan Silhouette Score. Hasil penelitian menunjukkan bahwa data pasien dapat dikelompokkan ke dalam tiga cluster dengan karakteristik risiko diabetes yang berbeda, yaitu risiko rendah, risiko sedang, serta risiko sedang hingga tinggi. Meskipun nilai Silhouette Score menunjukkan adanya tumpang tindih antar cluster, hasil pengelompokan tetap memberikan informasi yang bermakna dalam mengidentifikasi profil risiko diabetes. Penelitian ini menunjukkan bahwa metode K-Means Clustering efektif digunakan untuk memetakan faktor risiko diabetes berdasarkan indikator kesehatan dan dapat menjadi dasar dalam analisis serta pengambilan keputusan di bidang kesehatan.

Downloads

Published

21-02-2026

Issue

Section

Articles