Perbandingan Kinerja Algoritma Kmeans dengan Kmeans Median pada Deteksi Kanker Payudara

S Mutrofin, T Wicaksono, A Murtadho - Jurnal Informasi dan Teknologi, 2023 - jidt.org
S Mutrofin, T Wicaksono, A Murtadho
Jurnal Informasi dan Teknologi, 2023jidt.org
Clustering adalah salah satu tugas dari Data Mining berbasis unsupervised learning.
Clustering dapat digunakan untuk permasalahan di berbagai bidang, seperti pendidikan,
kesehatan, ekonomi, pertanian, hiburan, olah raga, dll. Salah satu algoritma clustering yang
sederhana dan umum digunakan pada tipe data numerik adalah Kmeans. Terlepas dari
segala kelebihan Kmeans, Kmeans memiliki permasalahan berupa pemilihan pusat awal
cluster atau centroid yang dipilih secara acak (random). Karena hasil akhir cluster dari …
Abstract
Clustering adalah salah satu tugas dari Data Mining berbasis unsupervised learning. Clustering dapat digunakan untuk permasalahan di berbagai bidang, seperti pendidikan, kesehatan, ekonomi, pertanian, hiburan, olah raga, dll. Salah satu algoritma clustering yang sederhana dan umum digunakan pada tipe data numerik adalah Kmeans. Terlepas dari segala kelebihan Kmeans, Kmeans memiliki permasalahan berupa pemilihan pusat awal cluster atau centroid yang dipilih secara acak (random). Karena hasil akhir cluster dari Kmeans sangat sensitif pada pemilihan awal cluster yang dapat menyebabkan konvergensi yang tidak optimal. Pada penelitian ini dilakukan perbandingan antara Kmeans dengan Kmeans Median dalam menentukan centroid awal yang bertujuan untuk mengetahui kinerja kedua algoritma yang paling optimal. Pada Kmeans Median, pemilihan centroid awal dipilih dengan menggunakan nilai median yang diambil dari kelompok data dan akan dicari nilai mediannya. Dataset yang digunakan dalam penelitian ini adalah Breast Cancer Coimbra yang dapat diakses di UCI Machine Learning Repository. Perhitungan jarak untuk kedua algoritma menggunakan euclidean distance. Pengujian pada penelitian ini untuk mengetahui kinerja kedua algoritma menggunakan Davies-Bouldin Index (DBI). Pengujian dilakukan empat kali pada masing-masing algoritma. Dari keempat pengujian tersebut, Kmeans mendapatkan DBI terbaik 0, 47 dan terburuk 0, 4796. Sedangkan pada Kmeans Median memiliki DBI 0, 47 pada keempat pengujiannya. Kinerja Kmeans berdasarkan iterasi antara 3, 5, dan 6. Sedangkan Kmeans Median iterasinya konsisten hanya 4. Berdasarkan komputasinya, Kmeans lebih unggul karena algoritmanya lebih sederhana, hal itu terlihat dari waktu yang dibutuhkan lebih sedikit dibandingkan Kmeans Median.
jidt.org
以上显示的是最相近的搜索结果。 查看全部搜索结果