Sejak konsep himpunan fuzzy diperkenalkan oleh Zadeh pada tahun 1965, konsep fuzzy clustering banyak dikembangkan dan diterapkan. Dalam konsep fuzzy clustering, suatu data dapat menjadi anggota dari beberapa cluster sekaligus menurut derajat keanggotaannya (Wu dan Yang, 2005). Proses clustering dalam algoritma fuzzy clustering selalu
mencari solusi terbaik untuk parameter yang telah didefinisikan. Namun
solusi terbaik ini belum tentu dapat menentukan deskripsi terbaik dari
struktur data. Dalam hal ini jumlah cluster yang ditentukan atau bentuk cluster mungkin tidak sesuai dengan data. Untuk menentukan jumlah cluster yang paling optimal dan dapat memvalidasi apakah partisi fuzzy yang diterapkan dalam proses clustering sesuai dengan data, digunakan indeks pengukuran validitas cluster (Balasko, ____).
Berikut ini adalah beberapa metode pengukuran validitas cluster yang umumnya digunakan untuk algoritma fuzzy clustering(Wu dan Yang, 2005) :
Dimana :
c = jumlah cluster
N = jumlah data
μij = derajat keanggotaan data ke-j pada cluster ke-i
PC(c) = nilai indeks PC pada cluster ke-c
Nilai PC berada dalam batas .
Pada umumnya jumlah cluster yang paling optimal ditentukan dari nilai PC yang paling besar
Dimana :
c = jumlah cluster
MPC(c) = nilai indeks MPC pada cluster ke-c
Nilai MPC berada dalam batas 0 ≤ PC(c) ≤ 1. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai MPC yang paling besar
Dimana :
c = jumlah cluster
N = jumlah data
μij = derajat keanggotaan data ke-j pada cluster ke-i
CE(c) = nilai indeks CE pada cluster ke-c
Nilai CE berada dalam batas 0 ≤ CE(c) ≤ log2c. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai PE yang paling kecil
Berikut ini adalah beberapa metode pengukuran validitas cluster yang umumnya digunakan untuk algoritma fuzzy clustering(Wu dan Yang, 2005) :
Partition Coefficient
Partition Coefficient (PC)merupakan metode yang mengukur jumlah cluster yang mengalami overlap. Indeks PC mengukur validitas cluster dengan rumus sebagai berikut :Dimana :
c = jumlah cluster
N = jumlah data
μij = derajat keanggotaan data ke-j pada cluster ke-i
PC(c) = nilai indeks PC pada cluster ke-c
Nilai PC berada dalam batas .
Pada umumnya jumlah cluster yang paling optimal ditentukan dari nilai PC yang paling besar
Modified Partition Coefficient
Partition Coefficient cenderung mengalami perubahan yang monoton terhadap beragam nilai c (jumlah cluster). Modifikasi dari indeks PC (Modified Partition Coefficient/MPC) dapat mengurangi perubahan yang monoton tersebut. dan didefinisikan dengan rumus berikut:Dimana :
c = jumlah cluster
MPC(c) = nilai indeks MPC pada cluster ke-c
Nilai MPC berada dalam batas 0 ≤ PC(c) ≤ 1. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai MPC yang paling besar
Classification Entropy
Classification Entropy (CE)merupakan metode yang mengukur tingkat kekaburan (fuzzyness) dari partisi cluster. Indeks CE mengukur validitas cluster dengan rumus sebagai berikut :Dimana :
c = jumlah cluster
N = jumlah data
μij = derajat keanggotaan data ke-j pada cluster ke-i
CE(c) = nilai indeks CE pada cluster ke-c
Nilai CE berada dalam batas 0 ≤ CE(c) ≤ log2c. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai PE yang paling kecil
No comments:
Post a Comment