Sabtu, 02 Mei 2015

Multiprocessor Fault Tolerance pada vSphere 6

Fault Tolerance adalah fitur canggih pada VMware vSphere, karena mampu melakukan zero-downtime fail over, tapi sayangnya pada versi sebelumnya Fault Tolerance hanya bisa digunakan untuk proteksi VM yang single processor yaitu yang hanya 1 vCPU, sedangkan VM yang memiliki lebih dari 1 vCPU maka tidak dapat menggunakan kecanggihan fitur Fault Tolerance ini, padahal hampir setiap VM yang statusnya sebagai mission-critical VM memiliki lebih dari 1 vCPU. Maka dari itu fitur Fault Tolerance ini hanya sekedar menjadi fitur yang dimiliki tapi jarang digunakan.

Pada vSphere 6, VMware melakukan improvement untuk fitur Fault Tolerance menjadi dapat men-support multiprocessor sampai maximal 4 vCPU per VM karena menggunakan Symmetric MultiProcessing (SMP), ini adalah perubahan positif yang sangat baik, karena dengan ini berarti VM mission critical yang di provisioned menggunakan 1-4 vCPU dapat diproteksi dengan fitur Fault Tolerance. Selain itu, pada VM yang menggunakan fitur Fault Tolerance pada vSphere 6 dapat dilakukan snapshot, sedangkan Fault Tolerance versi sebelumnya tidak support snapshot sehingga tidak dapat dibackup secara otomatis oleh software backup manager misalnya VDP atau backup manager third-party. Ini juga salah satu improvement yang menguntungkan.  Dan satu lagi kelebihannya adalah virtualdisk VM yang menggunakan fitur Fault Tolerance dapat diprovisione dengan thin-provisioned, karena pada versi sebelumnya hanya bisa thick-provisioned eager-zero.

Itulah yang menjadikan fitur Fault Tolerance pada vSphere 6 sebagai fitur yang ditunggu-tunggu oleh pada vSphere administrator.






















Berikut ini adalah tabel perbandingan fitur Fault Tolerance pada vSphere 5.x dengan pada vSphere 6





















Pada tabel diatas dapat dilihat bahwa cukup banyak peningkatan fitur Fault Tolerance pada vSphere 6, namun ada satu hal yang perlu diperhatikan pada tabel tersebut, yaitu Fault Tolerance network yang pada vSphere 6 harus menggunakan network 10Gbps. Berarti ini juga menjadi faktor kendala baru untuk menggunakan fitur Fault Tolerance, yaitu harus menyediakan koneksi network 10Gbps antar host.

Selain itu, beberapa perubahan konsep Fault Tolerance pada vSphere 6 adalah:
  • Ketika terjadi fail over, Fault Tolerance melakukan migrasi primary VM dan juga secondary VM
  • VM yang menggunakan fitur Fault Tolerance maka akan dicopy seluruh file VM nya termasuk virtualdisknya (VMDK)
  • Fault Tolerance melakukan sinkronisasi CPU antara primary VM dengan secondary VM dengan cara meng-copy checkpoint secara sangat cepat (karena itulah disyaratkan menggunakan network 10Gbps)
  • Fitur HA dan DRS pada cluster harus di enable, HA untuk memastikan konfigurasi CPU antara primary VM dengan secondary VM tetap identik, sedangkan DRS adalah untuk menentukan dimana ditempatkannya VM yang menggunakan fitur Fault Tolerance, tapi bukan untuk melakukan load-balancing compute resources.
Pada Fault Tolerance sebelumnya, virtualdisk di share antara primary VM (master) dengan secondary VM (slave) sehingga yang terpisah hanya file configurasi computenya saja yaitu file vmx. Sedangkan pada Fault Tolerance vSphere 6 dilakukan copy seluruh file VM termasuk virtualdisknya sehingga secondary VM adalah cloning dari primary VM yang ditempatkan pada datastore yang terpisah dengan datastore primary VM. Dengan konsep ini, maka tercipta redundancy bukan hanya pada file vmx saja, tapi juga pada keseluruhan file VM termasuk file vmdk, yaitu redundancy datastore bagi VM tersebut. Sehingga ini menjadi proteksi untuk recovery VM ketika terjadi datastore failure.

















Pada Fault Tolerance versi sebelumnya, input ke VM yang diproteksi dengan Fault Tolerance dilakukan sekaligus ke primary VM dan secondary VM secara bersamaan, namun hal ini menjadi kendala jika salah satu host diantara host primary VM dan host secondary VM mengalami utilisasi workload yang berbeda sehingga proses input menjadi tidak sama pada kedua host itu.

Pada versi 6, untuk menghindari kendala tersebut maka input hanya dilakukan pada primary VM saja
dan kemudian hasil input tersebut dikirim dari primary VM ke secondary VM dengan proses checkpoint data yang dilakukan secara dinamis relatif sangat cepat yaitu setidaknya setiap 10 milliseconds dengan CPU overhead yang sangat kecil.

Title: Multiprocessor Fault Tolerance pada vSphere 6; Written by Naufal; Rating: 5 dari 5

Tidak ada komentar:

Posting Komentar