Page 100 - Science and Technology For Society 5.0
P. 100
~ Science and Technology for Society 5.0 ~ 63
Sumber: Zhang & Waterman, 2004
Gambar 4. Penyejajaran Sekuens
Pada GenBank dari National Center for Biotechnology Information
(NCBI) dengan situs http://www.ncbi.nlm.nih.gov dapat ditelusuri sekuens
dari DNA dan protein. Format data dari sekuens DNA dan protein yang
diperoleh dari basis data GenBank adalah format FASTA. Format FASTA
mudah diproses oleh banyak perangkat lunak dan analisis sekuensnya
tersedia pada banyak basis data sekuens secara langsung (online) (Baxevanis
& Oullette, 2001; Bergeron, 2003; Isaev, 2004; Cristianini & Hahn, 2007).
Sebagai contoh format FASTA adalah sekuens protein hemaglutinin
(HA) dari virus A/swine/Hubei/02/2008 (H1N1) yang diperoleh dengan
penelusuran pada NCBI dengan nomor akses AFN06479, panjang
nukleotidanya adalah 566 aa (aa = amino acids), dan sumbernya adalah
protein hemaglutinin (HA) dari virus flu babi (swine) yang diisolasi di Hubei
pada tahun 2008 seperti pada Gambar 5.