BIOINFORMATIKA PROTEIN
1. Pengertian bioinformatika
Bioinformatika berasal dari kata bioinformatics (inggris) yakni ilmu
yang mempelajari penerapan teknik komputasional untuk mengelola dan
menganalisis informasi biologis. Bionformatika sendiri merupakan ilmu yang
lahiir dari perkembangan biologi molecular modern yang merupakan salah
satubentuk peningkatan pemahaman manusia dalam bidang genomic yang terdapat
dalam molekul DNA.Bidang bioinformatika mencakup penerapan metode-metode
matematika, statistika, dan informatika untuk memecahkan masalah biologis,
penyejajaran sekuens, prediksi struktur protein, analisis filogenetik, analisis
ekspresi gen, sampai struktur sekunder RNA.
2.
Sejarah perkembangan
bioinformatika
Istilah bioinformatics mulai dikemukakan pada pertengahan era
1980-an untuk mengacu pada penerapan computer dalam biologi. Namun demikian,
penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan
pengembangan algoritmauntuk analisis sekuens biologis) sudah dilakukan sejak
tahun 1960-an. Kemajuan teknik biologi molecular dalam mengungkap sekuens
biologis dari protein (sejak awal 1950-an) dan asam nukleat (sejak 1960-an)
mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis
data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat,
sementara basis data sekuens DNA dikembangkan pada akhir 1970-an di Amerika
Serikatdan Jerman (padaEuropean Molecular Biology Laboratory, Laboratorium
Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang lebih cepat pada
pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang
berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka jalan
bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan
dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.
3.
Bidang-bidang terkait
bioinformatika
·
Biophysics
Biologi molekul sendiri merupakan pengembangan yang lahir dari
biophysics. Biophysics adalah sebuah bidang yang mengaplikasikan teknik- teknik
dari ilmu Fisika untuk memahami struktur dan fungsi biologi (British
Biophysical Society). Sesuai dengan definisi tersebut, bidang ini merupakan
suatu bidang yang luas. Namun secara langsung disiplin ilmu ini terkait dengan Bioinformatika
karena penggunaan teknik-teknik dari ilmu Fisika untuk memahami struktur.
·
Computational Biology
Computational biology merupakan bagian dari Bioinformatika (dalam
arti yang paling luas) yang paling dekat dengan bidang Biologi umum klasik.
Fokus dari computational biology adalah gerak evolusi, populasi, dan biologi
teoritis daripada biomedis dalam molekul dan sel. Tak dapat dielakkan bahwa
Biologi Molekul cukup penting dalam computational biology, namun itu bukanlah
inti dari disiplin ilmu ini. Pada penerapan computational biology, model-model statistika
untuk fenomena biologi lebih disukai dipakai dibandingkan dengan model
sebenarnya. Dalam beberapa hal cara tersebut cukup baik mengingat pada kasus
tertentu eksperimen langsung pada fenomena biologi cukup sulit. Tidak semua
dari computational biology merupakan Bioinformatika, seperti contohnya Model
Matematika bukan merupakan Bioinformatika, bahkan meskipun dikaitkan dengan
masalah biologi.
·
Medical Informatics
Medical informatics lebih memperhatikan struktur dan algoritma
untuk pengolahan data medis, dibandingkan dengan data itu sendiri. Disiplin
ilmu ini, untuk alasan praktis, kemungkinan besar berkaitan dengan data-data
yang didapatkan pada level biologi yang lebih “rumit” – yaitu informasi dari
sistem-sistem super selular, tepat pada level populasi— di mana sebagian besar dari
Bioinformatika lebih memperhatikan informasi dari sistem dan struktur
biomolekul dan selular.
·
Cheminformatics
Cheminformatics
adalah kombinasi dari sintesis kimia, penyaringan biologis, dan pendekatan data-mining
yang digunakan untuk penemuan dan pengembangan obat (Cambridge
HealthechInstitute’s Sixth Annual Cheminformatics conference). Pengertian
disiplin ilmu yang disebutkan diatas lebih merupakan identifikasi dari salah
satu aktivitas yang paling populer dibandingkan dengan berbagai bidang studi
yang mungkin ada di bawah bidang ini. Salah satu contoh penemuan obat yang
paling sukses sepanjang sejarah adalah penisilin, dapat menggambarkan cara
untuk menemukan dan mengembangkan obat-obatan hingga sekarang meskipun terlihat
aneh. Cara untuk menemukan dan mengembangkan obat adalah hasil dari kesempatan,
observasi, dan banyak proses kimia yang intensif dan lambat. Sampai beberapa waktu
yang lalu, desain obat dianggap harus selalu menggunakan kerja yang intensif,
proses ujidan gagal (trial-error process). Ruang lingkup pembelajaran dari
cheminformatics ini sangat luas. Contoh bidang minatnya antara lain: Synthesis
Planning, Reaction and Structure Retrieval, 3-D Structure Retrieval,Modelling,
Computational Chemistry, Visualisation Tools and Utilities.
·
Genomics
Genomics adalah bidang ilmu yang ada sebelum selesainya sekuen
genom, kecuali dalam bentuk yang paling kasar. Genomics adalah setiap usaha
untuk menganalisa atau membandingkan seluruh komplemen genetik dari satu
spesies atau lebih. Secara logis tentu saja mungkin untuk membandingkan
genom-genom dengan membandingkan kurang lebih suatu himpunan bagian dari gen di
dalam genom.
·
Proteomics
Istilah proteomics pertama kali digunakan untuk menggambarkan
himpunan dari protein-protein yang tersusun (encoded) oleh genom. Ilmu yang
mempelajari proteome, yang disebut proteomics, pada saat ini tidak hanya
memperhatikan semua protein di dalam sel yang diberikan, tetapi juga himpunan
dari semua bentuk isoform dan modifikasi dari semua protein,interaksi
diantaranya, deskripsi struktural dari protein-protein dan kompleks-kompleks
ordetingkat tinggi dari protein. Mengkarakterisasi sebanyak puluhan ribu
protein-protein yang dinyatakan dalam sebuah tipesel yang diberikan pada waktu
tertentu– apakah untuk mengukur berat molekul atau nilai-nilaiisoelektrik
protein-protein tersebut– melibatkan tempat penyimpanan dan perbandingan
daridata yang memiliki jumlah yang sangat besar, tak terhindarkan lagi akan
memerlukan Bioinformatika.
·
Pharmacogenomics
Pharmacogenomics adalah aplikasi dari pendekatan genomik dan
teknologi pada identifikasi dari target-target obat. Contohnya meliputi
menjaring semua genom untuk penerima yang potensial dengan menggunakan cara
Bioinformatika, atau dengan menyelidiki bentuk pola dari ekspresigen di dalam
baik patogen maupun induk selama terjadinya infeksi, atau maupun dengan memeriksa
karakteristik pola-pola ekspresi yang ditemukan dalam tumor atau contoh
daripasien untuk kepentingan diagnosa (kemungkinan untuk mengejar target
potensial terapi kanker).
·
Pharmacogenetics
Tiap
individu mempunyai respon yang berbeda-beda terhadap berbagai pengaruh obat; sebagian
ada yang positif, sebagian ada yang sedikit perubahan yang tampak pada
kondisimereka dan ada juga yang mendapatkan efek samping atau reaksi alergi.
Sebagian dari reaksi-reaksi ini diketahui mempunyai dasar genetik.
Pharmacogenetics adalah bagian dari pharmacogenomics yang menggunakan metode
genomik/Bioinformatika untuk mengidentifikasihubungan-hubungan genomik,
contohnya SNP (Single Nucleotide Polymorphisms), karakteristik dari profil
respons pasien tertentu dan menggunakan informasi-informasi tersebut untuk memberitahu
administrasi dan pengembangan terapi pengobatan.4.
4. Penerapan utama bioinformatika
·
Basis data sekuens biologis
Sesuai dengan jenis informasi biologis yang disimpannya, basis
datasekuens biologis dapat berupa basis data primer untuk menyimpan sekuens
primer asam nukleat maupun protein, basis data sekunder untuk menyimpan motif
sekuens protein, dan basis data struktur untuk menyimpan data struktur protein
maupun asam nukleat. Basis data utama untuk sekuens asam nukleat saat ini
adalah GenBank (AmerikaSerikat), EMBL(Eropa), dan DDBJ(Inggris) (DNA Data Bank
of Japan, Jepang). Ketiga basis datatersebut bekerja sama dan bertukar data
secara harian untuk menjaga keluasan cakupan masing-masing basis data. Sumber
utama data sekuens asam nukleat adalah submisi langsung dari periset
individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi
sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya
mengandung informasi tentang jenis asam nukleat (DNAatau RNA), nama organisme sumber
asam nukleat tersebut,dan pustaka yang berkaitan dengan sekuens asam nukleat
tersebut. Sementara itu, contoh beberapa basis data penting yang menyimpan
sekuens primer protein adalah PIR(Protein Information Resource, Amerika
Serikat), Swiss-Prot(Eropa), dan TrEMBL(Eropa). Ketiga basis data tersebut
telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat).
Entri dalam UniProt mengandung informasi tentang sekuens protein, nama
organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya
berisi penjelasan mengenai fungsi protein tersebut. BLAST(Basic Local Alignment
Search Tool) merupakan perkakas bioinformatika yang berkaitan erat dengan
penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis
data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein
yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya
untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa
keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing.
Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens. PDB(Protein
Data Bank, Bank Data Protein) adalah basis data tunggal yang menyimpan model struktural
tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan
kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan
data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi
atom-atom dalam protein ataupun asam nukleat.
·
Penyejajaran sekuens
Penyejajaran sekuens (sequence alignment) adalah proses
penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan sekuens-sekuens
tersebut tampak nyata. Hasil dari proses tersebut juga disebut sebagai sequence
alignment atau alignment saja. Baris
sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "
–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik
atau sama di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment
DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac"
dan"caatgggcaac" (tanda "|" menunjukkan kecocokan atau
match di antara kedua sekuens).
Sequence alignment merupakan metode dasar dalam analisis sekuens.
Metode ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur
yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment
diasosiasikan dengan proses mutasi, sedangkankesenjangan (gap, tanda
"–") diasosiasikan dengan proses insersi atau delesi. Sequence alignment
memberikan hipotesisatas proses evolusi yang terjadi dalam sekuens-sekuens tersebut.
Misalnya, kedua sekuens dalam contoh alignment di atas bisa jadi berevolusi
dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini,
alignment juga dapat menunjukkan posisi-posisi yang dipertahankan (conserved)
selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa
posisi-posisi tersebut bisa jadi penting bagi struktur atau fungsi protein
tersebut. Selain itu, sequence alignment juga digunakan untuk mencari sekuens
yang mirip atau sama dalam basis data sekuens. BLAST adalah salah satu metode
alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST
menggunakan algoritma heuristic dalam penyusunan alignment. Beberapa metode
alignment lain yang merupakan pendahulu BLAST adalah
metode"Needleman-Wunsch" dan "Smith-Waterman". Metode
Needleman-Wunsch digunakan untuk menyusun alignment global di antara dua atau
lebih sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut.
Metode Smith-Waterman menghasilkan alignment lokal, yaitu alignment atas
bagian-bagian dalam sekuens. Kedua metode tersebut menerapkan pemrograman
dinamik (dynamic programming) dan hanya efektif untuk alignment dua sekuens
(pairwise alignment). Clustal adalah program bioinformatika untuk alignment
multipel (multiple alignment),yaitu alignment beberapa sekuens sekaligus. Dua
varian utama Clustal adalah ClustalWdan ClustalX. Metode lain yang dapat
diterapkan untuk alignment sekuens adalah metode yang berhubungandengan Hidden
Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan
modelstatistika yang mulanya digunakan dalam ilmu komputeruntuk mengenali
pembicaraan manusia(speech recognition). Selain digunakan untuk alignment, HMM
juga digunakan dalam metode-metode analisis sekuens lainnya, seperti prediksi
daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.
·
Prediksi struktur protein
Secara kimia/fisika, bentuk struktur protein diungkap dengan
kristalografi sinar-X ataupun spektroskopi NMR, namun kedua metode tersebut
sangat memakan waktu dan relatif mahal. Sementara itu, metode sekuensing protein
relatif lebih mudah mengungkapkan sekuens asam aminoprotein. Prediksi struktur
protein berusaha meramalkan struktur tiga dimensi protein berdasarkan sekuens
asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder
berdasarkan struktur primer protein). Secara umum, metode prediksi struktur
protein yang ada saat ini dapat dikategorikan ke dalam duakelompok, yaitu
metode pemodelan protein komparatif dan metode pemodelan de novo.Pemodelan
protein komparatif (comparative protein modelling) meramalkan struktur
suatuprotein berdasarkan struktur protein lain yang sudah diketahui. Salah satu
penerapan metodeini adalah pemodelan homologi (homology modelling), yaitu
prediksi struktur tersier protein berdasarkan kesamaan struktur primer protein.
Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog memiliki
struktur yang sangat mirip satu sama lain. Pada metode ini, struktur suatu
protein (disebut protein target) ditentukan berdasarkan struktur protein lain (protein
templat) yang sudah diketahui dan memiliki kemiripan sekuens dengan protein
target tersebut. Selain itu, penerapan lain pemodelan komparatif adalah protein
threading yang didasarkan pada kemiripan struktur tanpa kemiripan sekuens
primer. Latar belakang protein threading adalah bahwa struktur protein lebih
dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang
penting bagi fungsi protein dipertahankan strukturnya. Pada pendekatan ini,
struktur yang paling kompatibel untuk suatu sekuens asam amino dipilih dari
semua jenis struktur tiga dimensi protein yang ada. Metode-metode yang tergolong
dalam protein threading berusaha menentukan tingkat kompatibilitas tersebut. Dalam
pendekatan de novo atau ab initio, struktur protein ditentukan dari sekuens
primernya tanpa membandingkan dengan struktur protein lain. Terdapat banyak
kemungkinan dalam pendekatan ini, misalnya dengan menirukan proses pelipatan
(folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya
dengan simulasi dinamika molekular), atau dengan optimisasi global fungsi
energi protein. Prosedur-prosedur ini cenderung membutuhkan proses komputasi
yang intens, sehingga saat ini hanya digunakan dalam menentukan struktur protein-protein
kecil. Beberapa usaha telah dilakukan untuk mengatasi kekurangan sumber
dayakomputasi tersebut, misalnya dengan supercomputer (misalnya superkomputer
BlueGene [1]dari IBM) atau komputasi terdistribusi (distributed computing,
misalnyaproyek Folding@home) maupun komputasi grid.
·
Analisis ekspresi gen
Ekspresi gendapat ditentukan dengan mengukur kadar mRNA dengan
berbagai macam teknik (misalnya dengan microarray ataupun Serial Analysis of
Gene Expressio["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik
tersebut umumnya diterapkan pada analisis ekspresi gen skala besar yang
mengukur ekspresi banyak gen (bahkan genom) dan menghasilkan data skala besar.
Metode-metode penggalian data (data mining) diterapkan pada data tersebut untuk
memperoleh pola-pola informatif. Sebagai contoh, metode-metode komparasi
digunakan untuk membandingkan ekspresi di antara gen-gen, sementara
metode-metode klastering (clustering)digunakan untuk mempartisi data tersebut
berdasarkan kesamaan ekspresi gen.
5.
Penerapan pada bidang lainnya
·
Bioinformatika dalam bidang
klinis
Perananan Bioinformatika dalam bidang klinis ini sering juga
disebut sebagai informatika klinis(clinical informatics). Aplikasi dari
clinical informatics ini adalah berbentuk manajemen data-data klinis dari
pasien melalui Electrical Medical Record (EMR) yang dikembangkan oleh Clement
J.McDonald dari Indiana University School of Medicine pada tahun 1972. McDonald
pertama kali mengaplikasikan EMR pada 33 orang pasien penyakit gula (diabetes).
Sekarang EMR ini telah diaplikasikan pada berbagai penyakit. Data yang disimpan
meliputi data analisa diagnose laboratorium, hasil konsultasi dan saran, foto
ronsen, ukuran detak jantung, dll. Dengan data ini dokter akan bisa menentukan
obat yang sesuai dengan kondisi pasien tertentu. Lebih jauhlagi, dengan dibacanya
genom manusia, akan memungkinkan untuk mengetahui penyakit genetik seseorang,
sehingga personal care terhadap pasien menjadi lebih akurat. Sampai saat ini
telah diketahui beberapa gen yang berperan dalam penyakit tertentu beserta posisinya
pada kromosom. Informasi ini tersedia dan bisa dilihat di home page National
Centerfor Biotechnology Information (NCBI) pada seksi Online Mendelian in Man
(OMIM)(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM). OMIM adalah
search tool untuk gen manusia dan penyakit genetika. Selain berisikan informasi
tentang lokasi gen suatu penyakit, OMIM ini juga menyediakan informasi tentang
gejala dan penanganan penyakit tersebut beserta sifat genetikanya. Dengan
demikian, dokter yang menemukan pasien yangmembawa penyakit genetika tertentu
bisa mempelajarinya secara detil dengan mengakses home page OMIM ini.
·
Bioinformatika untuk penemuan
obat
Usaha penemuan obat biasanya dilakukan dengan penemuan zat/senyawa
yang bisa menekan perkembangbiakan suatu agent penyebab penyakit. Karena banyak
faktor yang bisa mempengaruhi perkembangbiakan agent tersebut, faktor-faktor
itulah yang dijadikan target. Diantara faktor tersebut adalah enzim-enzim yang
diperlukan untuk perkembangbiakan suatua gent. Langkah pertama yang dilakukan
adalah analisa struktur dan fungsi enzim-enzim tersebut. Kemudian mencari atau
mensintesa zat/senyawa yang bisa menekan fungsi dari enzim-enzim
tersebut.Penemuan obat yang efektif adalah penemuan senyawa yang berinteraksi
dengan asam amino yang berperan untuk aktivitas (active site) dan untuk
kestabilan enzim tersebut. Karena itu analisa struktur dan fungsi enzim ini
biasanya difokuskan pada analisa asam aminoyang berperan untuk aktivitas
(active site) dan untuk kestabilan enzim tersebut. Analisa inidilakukan dengan
cara mengganti asam amino tertentu dan menguji efeknya. Sebelum perkembangan
bioinformatika, analisa penggantian asam amino ini dilakukan secara random sehingga
memakan waktu yang lama. Dengan adanya Bioinformatika, data-data protein yang sudah
dianalisa bebas diakses oleh siapapun, baik data sekuen asam amino-nya seperti
yangada di SWISS-PROT(http://www.ebi.ac.uk/swissprot/) maupun struktur 3D-nya
yang tersedia di Protein Data Bank (PDB)(http://www.rcsb.org/pdb/). Dengan
database yang tersedia ini, enzimyang baru ditemukan bisa dibandingkan sekuen
asam amino-nya, sehingga bisa diperkirakan asam amino yang berperan untuk
active site dan kestabilan enzim tersebut. Hasil perkiraan kemudian diuji di
laboratorium. Dengan demikian, akan lebih menghemat waktu dari padaanalisa
secara random.
·
Bioinformatika dalam Virologi
Sebelum kemajuan bioinformatika, untuk mengklasifikasikan virus
kita harus melihat morfologinya terlebih dahulu. Untuk melihat morfologi virus
dengan akurat, biasanya digunakan mikroskop elektron yang harganya sangat mahal
sehingga tidak bisa dimiliki oleh semua laboratorium. Selain itu, kita harus
bisa mengisolasi dan mendapatkan virus itu sendiri. Isolasi virus adalah suatu
pekerjaan yang tidak mudah. Banyak virus yang tidak bisa dikulturkan, apalagi
diisolasi. Virus hepatitis C (HCV), misalnya, sampai saat ini belum ada yang
bisa mengkulturkannya, sehingga belum ada yang tahu bentuk morfologi virus ini.
Begitu juga virushepatitis E (HEV) dan kelompok virus yang termasuk ke dalam
family Calliciviridae, dimana sampai saat ini belum ditemukan sistem
pengkulturannya. Walaupun untuk beberapa virus bisa dikulturkan, tidak semuanya
bisa diisolasi dengan mudah.Oleh karena itu, sebelum perkembangan
bioinformatika, kita tidak bisa mengidentifikasi dan mengklasifikasikan
virus-virus semacam ini. Dengan kemajuan teknik isolasi DNA/RNA, teknik
sekuensing dan ditunjang dengan kemajuan bioinformatika, masalah diatas bisa
teratasi. Untuk mengidentifikasi dan mengklasifikasikan virus, isolasi virus
tidak lagi menjadi suatu hal yang mutlak. Kita cukup dengan hanya melakukan
sekuensing terhadap gen-nya. Ini adalah salah satu hasil kemajuan
bioinformatika yang nyata dalam bidang virologi.
Sumber:
Nama : Ni Putu Yuan Antaputeri
NPM : 54410952
Kelas : 4IA14
Anggota Kelompok :
- Nanda Fitria
- Bagus Dyan
- Muhamad Yoga
- Muhamad Rifai