Detail Cantuman Kembali
ALGORITMA CLUSTERING K-MEANS DALAM ANALISIS CLUSTER GAJI BERDASARKAN DATA DEMOGRAFI DENGAN MECHINE LEARNING MENGGUNAKAN PYTHON
Penelitian ini mengadopsi metode K-Means Clustering dalam analisis gaji
berdasarkan data demografis, dengan tujuan memahami pola pengelompokan gaji
karyawan berdasarkan faktor-faktor demografis yang relevan. Metode K-Means dipilih
karena kemampuannya dalam mengelompokkan data secara efisien dan efektif, serta
kemampuannya dalam menangani data unsupervised learning. Dalam konteks ini, KMeans
dapat membantu mengidentifikasi pola pengelompokan gaji yang tidak terlihat
secara langsung oleh analisis tradisional.
Proses analisis dimulai dengan persiapan data dengan jumlah 3000 baris data,
yang melibatkan pembersihan, transformasi data menjadi numerik, penghapusan
outlier dan penskalaan . Langkah ini untuk memastikan kualitas data yang digunakan
dalam analisis. Setelah itu, dilakukan pemilihan model dan klastering menggunakan
algoritma K-Means dengan python. Proses ini melibatkan penentuan jumlah cluster
yang optimal dengan metode elbow atau siku, dan pembentukan cluster menggunakan
centroid dan pengelompokan objek berdasarkan jarak minimum ke centroid.
Hasil evaluasi menunjukkan bahwa K-Means dengan 2 cluster optimal dimana
cluster 1 terdapat 1518 data dengan rata-rata gaji Rp 7jt dan cluster 2 terdapat 1482
baris data dengan rata-rata gaji Rp 8jt. Dua cluster ini menghasilkan Silhouette Score
sebesar 0.9972 mendekati 1 dan Davies-Bouldin Index sebesar 0.00178 mendekati nol,
menunjukkan kualitas klastering yang sangat baik dan k=2 adalah nilai k yang paling
optimal.
Kata kunci: K-Means Clustering, Analisis Gaji, Davies-Bouldin Index , Silhouette
Score
031 YAN A R.1
NONE
Text Skripsi
Indonesia
UNIVERSITAS TEKNOLOGI DIGITAL INDONESIA (UTDI)
2024
Yogyakarta
LOADING LIST...
LOADING LIST...