Page 94 - Science and Technology For Society 5.0

P. 94

~ Science and Technology for Society 5.0 ~ 57

menjadi beberapa kelompok (cluster) berdasarkan kemiripan dan klasifikasi.
Salah satu proses pengelompokan adalah pengelompokan graf yang
merupakan pengelompokan simpul-simpul pada sebuah graf berdasarkan
pada ada atau tidaknya hubungan antara simpul dan seberapa kuat
hubungan yang terjadi antara satu simpul dengan simpul yang lainnya. Salah
satu metode pengelompokkan graf adalah markov clustering.
Markov Clustering Algoritm (MCL) merupakan metode yang dilakukan
dengan beberapa iterasi (bootstrapping) dan memiliki faktor
penggelembungan (inflation) yang mempengaruhi kepadatan (granularity)
dari kelompok yang dihasilkan, dimana kelompok (cluster) tersebut
setimbang dan non-hirarki (flat) (Dongen, 2000). Algoritma ini
dikembangkan oleh Stijn van Dongen pada tahun 2000 dan telah
diimplementasikan di berbagai bidang ilmu, salah satunya di bidang
bioinformatik seperti pada jaringan interaksi protein, analisis famili protein
dan gen dari spesies tunggal maupun antarspesies, analisis ruang sekuens,
orthologus groups, protein kinase, protein tersekretasi, protein mata,
elemen genetis yang bersifat mobile, dan penentuan fungsi protein. Selain
itu, MCL juga banyak dipakai di bidang corpus linguistic, pencarian gambar
yang bersifat content-based, analisis peer-to-peer network, dan analisis
jejaring sosial (Dongen, 2008).
Beberapa faktor yang mendorong banyaknya penggunaan algoritma
MCL meliputi kemampuan algoritma ini untuk menghasilkan clustering non-
hierarkis yang setimbang (well-balanced), merupakan metode
bootstrapping, memiliki parameter natural (inflation) yang dapat
mempengaruhi glanuralitas dari cluster yang dihasilkan, dapat
diimplementasikan dalam sparse graf/matriks yang berimplikasi pada
skalabilitas yang baik, serta adanya hasil matematis yang dapat menjelaskan
hubungan erat dari setiap iterasi proses MCL, interpretasi cluster, inflation,
dan jumlah dari cluster yang dihasilkan (Dongen, 2008). Metode lain yang
merupakan pengembangan dari MCL adalah Tribe Markov Clustering.
Dalam melakukan proses clustering, salah satu hal yang menjadi tujuan
utama adalah meminimalisir jumlah cluster yang berukuran besar, sebab
kompleks protein cenderung hanya memiliki sekitar 15-30 node. Serupa
dengan itu, output berupa singleton cluster juga perlu diminimalisir
jumlahnya, sebab node tunggal tidak mengandung cukup informasi yang
bisa digunakan untuk mengidentifikasi interaksi dalam sebuah network.
Pada bidang bioinformatika, data yang dikelompokkan biasanya berukuran

89 90 91 92 93 94 95 96 97 98 99