09 Dez

Hyper-V / Symantec Netbackup – VMs get stuck in status „Backing up“

Lessons learned aus der Praxis:

In Zusammenhang mit einem großen Hyper-V Clusterverbunds (streched über zwei Standorte) wurde mittels Symantec NetBackup mit Snapshottechnologie gesichert. Tritt in irgendeiner Art und Weise ein Fehler auf, so dass der Master Server von Symantec crashed oder hart vom Netz genommen wird, so bleiben die VMs im Status „Backing up“. Dies hat zur Folge, dass die VMs nicht migriert oder heruntergefahren werden können (nur im VM OS selber) – nicht mittels Hyper-V Konsole, VMM oder Failover Cluster Manager.

Die Ursache liegt an dem Symantec Dienst bpfis.exe, welcher den Snapshot anstößt, kontrolliert und wieder auflöst. Wenn der Master Server crashed, dann kann das Problem durch Beenden des bpfis.exe Tasks behoben werden. Hyper-V bekommt dies nach kurzer Zeit mit und führt den Snapshot wieder zusammen.

In eigener Sache:
Natürlich passiert der Crash in der Praxis nicht wirklich häufig, da in einer virtualisierten Umgebung doch alles recht hochverfügbar ausgelegt ist. Da wir uns hier im konkreten Fall allerdings zwischen der Aufbau und Pilotphase befanden, ist der Masterserver leider ab und zu in Mitleidenschaft gezogen worden. Natürlich haben wir eine dauerhafte Lösung für das Problem angestrebt. Symantec hat das Problem bestätigt, aber aufgrund der niedrigen Priorität leider keine Dev-Ressourcen freigegeben.

Zitat:
„Your request to have the Snapshot deletion process automated to delete the bpfis process and disk shadows, presently there is currently no mechanism in NetBackup to do this with Hyper-V.“

In VMWare gibt es hierzu eine Lösung in Zusammenhang mit NBU. Auf Seiten Hyper-V leider nicht.