Failover und Failback in einer DR-Situation

Katastrophen, ob natürlich oder böswillig herbeigeführt, treten selten dann ein, wenn man sie erwartet. In einer DR-Situation (Disaster Recovery) müssen Sie Ihre digitale Infrastruktur schnell und effizient wiederherstellen. Failover und Failback sind Geschäftskontinuitäts-Tools, die dabei helfen, den normalen virtuellen Betrieb selbst dann aufrechtzuerhalten, wenn Ihre primäre Produktionsstätte ausfällt.

Betrachten Sie Failover- und Failback-Prozesse als wichtige ergänzende Elemente eines robusten DR-Frameworks. Beim Failover wird die Produktion von einem primären Standort auf einen Backup-Standort (Wiederherstellungs-Standort) verlagert. Bei einem Failback wird die Produktion an den ursprünglichen (oder neuen) primären Standort zurückverlagert, nachdem eine Katastrophe (oder ein geplantes Ereignis) behoben wurde.

Katastrophal Systemausfall

Im Falle eines katastrophalen Ausfalls können Sie jedes betroffene System schnell wiederherstellen, indem Sie ein Failover auf eine kopierte Version durchführen. In diesem Zusammenhang ist das Failover die Verlagerung von geschäftskritischen Workloads von einem gefährdeten primären Produktionssystem zu einem festgelegten Wiederherstellungsstandort, wodurch der Betrieb des Produktionssystems wiederhergestellt wird. Ein Failover mildert die Auswirkungen einer Unterbrechung ab, indem es den Betrieb auch bei einem potenziell schwerwiegenden Systemausfall aufrechterhält.

Die (externe) Remote-Systemkopie wird dann beim Failover initialisiert und ersetzt das ursprüngliche System. Je nach Art des Fehlerereignisses können Sie auf das neueste System-Image oder auf ein bestimmtes, ausgewähltes Wiederherstellungs-Image zurückgreifen. Häufiges Kopieren von System-Images stellt sicher, dass Sie mehrere Systemversionen beibehalten, und minimiert den Datenverlust. Ein Failover auf eine kuratierte Kopie Ihres Systems ist eine kosteneffiziente Methode zum Schutz vor IT-Systemausfällen.

Nach der Wiederherstellung des primären Standorts – und der Beseitigung aller damit verbundenen Sicherheitsrisiken oder anderer ausfallbedingter Probleme – können Sie den Geschäftsbetrieb auf Ihrem Produktionssystem wiederherstellen. Mit einem Failback können Sie das Image von vor der Katastrophe auf dem ursprünglichen Produktionssystem (oder einem anderen ausgewählten Produktionsstandort) wiederherstellen und Workloads von dem kopierten System auf dem designierten Produktionssystem wiederherstellen. Es ist jedoch wahrscheinlich, dass nach dem Failover inkrementelle Änderungen im Wiederherstellungssystem erfolgen werden. Daher müssen Sie das wiederhergestellte/neue Produktionssystem vor dem Failback mit dem kopierten System synchronisieren, um den Verlust geschäftskritischer Informationen zu vermeiden. Bei der Durchführung eines Failbacks sollten nur die im Wiederherstellungssystem gespeicherten (geänderten) Interimsdaten auf das neue/wiederhergestellte Produktionssystem zurückübertragen werden.
 

Failover und Failback

Wenn ein Fehler erkannt wird, wechselt ein Failover-Workflow zu einem Wiederherstellungssystem als Datenquelle, während ein Failback-Workflow die Daten nach einem Ransomware-Ereignis oder einem anderen Datenverlust im Unternehmen wieder in den ursprünglichen Zustand zurückversetzt.

Hier erfahren Sie, worauf Sie bei Failover/Fallback vorbereitet sein sollten:

  1. Im Rahmen jedes DR-Plans wird zunächst das System des primären Produktionsstandorts auf ein festgelegtes Wiederherstellungsstandortsystem kopiert. Die Daten auf dem kopierten System spiegeln die Daten auf dem Quellsystem zum Zeitpunkt des Kopierens wider. Im Falle eines auslösenden Ereignisses wird ein automatischer Failover auf das Wiederherstellungssystem initialisiert.
  2. Während eines Failover-Ereignisses werden die Produktions-Workloads auf den Wiederherstellungsstandort übertragen, obwohl bei fortgesetztem Betrieb einige Änderungen auftreten können. Alle Änderungen während eines Ausfallereignisses werden in den virtuellen Speicher geschrieben, der dem Wiederherstellungssystem zugeordnet ist.
  3. Nachdem alle ausfallbedingten Unterbrechungen und Datenverluste behoben und alle bekannten Bedrohungen entschärft wurden, kann der primäre Produktionsstandort den Betrieb wieder aufnehmen. Zu diesem Zeitpunkt wird der Failback-Vorgang ausgeführt; die Produktions-Workloads werden vom Wiederherstellungsstandort zurückübertragen und die Interims-Update-Daten werden auf das Primärsystem übertragen. Das neue/wiederhergestellte Produktionssystem und das Wiederherstellungssystem können dann synchronisiert werden.

Rubriks Lösung 

Unsere Replikations- und Disaster-Recovery-Lösung integriert Failover- und Failback-Vorgänge in einen nahtlosen und umfassenden Management-Framework. Rubrik automatisiert unterbrechungsfreie Failover-Tests und Migrationen in die Public Cloud, um Risiken zu minimieren und Compliance-Vorgaben einzuhalten. Die Rubrik DR-Software überwacht Replikationsaufgaben und den DR-Failover-Status, verfolgt die Einhaltung der Replikationsrichtlinien und sammelt proaktive Fehler-/Warnmeldungen. Wir bieten eine vereinfachte DR-Orchestrierung mit Failover/Failback, Tests und Cloud-Migration.

Erfahren Sie, wie Rubrik Ihnen mit erstklassigen Replikations- und Disaster-Recovery-Lösungen helfen kann, Ihre Daten zu schützen.