FAULT TOLERANCE
Salah satu tujuan dalam membangun
sebuah system terdistribusi adalah memungkinkan untuk melakukan improvisasi
terhadap kehandalan sistem. Ini dilakukan karena setiap system pasti akan
menemukan kesalahan atau gangguan. Sehingga perlu untuk dibuat pencegahan atau
solusi untuk mengatasi masalah tersebut. Availability: kalau mesin mati (down),
sistem tetap harus berjalan dengan jumlah layananan yang tersisa. Dalam
suatu sistem terdistribusi komponen dalam system yang sangat vital terutama
pada resources (critical resources) berjumlah seminimal mungkin. Yang
dimaksud dengan critical resources adalah komponen dalam system yang harus ada
untuk menjalankan sistem terdistribusi.
Secara umum, ada dua jenis fault
tolerant, yaitu fault tolerant secara hardware dan secara software. Untuk itu,
masing - masing Software dan Hardware harus di replikasi. Sehingga kalau
terjadi kegagalan / error maka yang lain akan menangani. Data dalam sistem
terdistribusi tidak boleh hilang, oleh karena itu copy dari data atau resource
lainnya tersebut disimpan secara redundan pada server lain, tapi tetap harus
dijaga konsistensi datanya. Hal ini memang berkaitan dengan replikasi.
Dengan membuat system terdistribusi yang fault tolerance maka Sistem harus bisa
mendeteksi kegagalan dan melakukan tindakan dasar sebagai berikut:
1. Mask the fault (menutupi
kegagalan): tugas harus dapat dilanjutkan dengan menurunkan kinerja tapi
tanpa terjadi kehilangan data atau informasi.
2. Fail Gracefully: membuat suatu
antisipasi terhadap suatu kegagalan ke suatu prosedur yang telah di
rencanakan dan memungkinkan untuk menghentikan proses dalam waktu yang
singkat tanpa menghilangkan informasi atau data.
0 komentar:
Posting Komentar