HPE ist in letzter Zeit nicht mehr so verfügbar wie „früher“. Seit der grossen „Greenlake“ Direktive nimmt die Qualität und vor allem die Verfügbarkeit der Software und Services spürbar ab – aber zumindest für Infosight (SCM) gibt es einen brauchbaren Workaround.
Es gibt einen direkten Download für den SCM. Am einfachsten geht das direkt an der Konsole:
Das Alletra Multipath-IO (MPIO) braucht den „Nimble Connection Manager“ (NCM) für vSphere. Das ist ein kleines VIB auf dem ESXi Host.
⚠️ Die Installation des selbigen erfordert zwei (!) reboots des Host.
Das VIB kann man aber zum Glück auch ohne offline-Zauberei, Download aus dem Infosight-Support-Center und so weiter installieren. Noch nicht alle Teile von HPE wurden vom Greenlake-Virus zerstört 🙂
Lösung
Den NCM an der Konsole installieren oder aktualisieren:
Dazu muss der ESXi Hosts selbstverständlich (temporär) ins Internet dürfen. Obwohl die Installation nach dem Abschluss behauptet Reboot Required: false ist dieser notwendig, sonst greifen die MPIO-Policies nicht.
Ältere HP Switches oder andere embedded-Systeme sprechen schon mal kein aktuelles SSH und aus Sicherheitsgründen lehnt der Default SSH-Client die Verbindung ab. Es gibt eine ganze Menge Key-Exchange-Methoden, die mittlerweile veraltet sind oder als unsicher gelten.
Der entscheidende Teil ist dabei der Letzte, der Angibt, welche Verfahren der Server anbietet:
Unable to negotiate with SWITCH.EXAMPLE.COM port 22: no matching key exchange method found. Their offer: diffie-hellman-group14-sha1
Denn man muss seinem SSH-Client nur noch beibringen, dass dieser das für diese Verbindung akzeptieren soll.
Lösung
SSH versteht mit dem Parameter -o die „optionalen“ Verfahren für die Verbindung:
Für den supergeheimen „xtd-cli-mode“, den man braucht um einen OfficeConnect 1950 vernünftig am CLI (via SSH) zu verwalten, gibt es ein noch viel geheimeres Kennwort. Wir haben keine Ahnung warum.
Manchmal schlagen Firmware-Updates auf Alletra 5000 Storages (früher Nimble AF und HF) fehl. Die Fehlermeldung dazu lautet im GUI und an der Shell wenig hilfreich:
One of the HPE Nimble Storage services has become unreachable. If this occurred during a failover or planned outage, wait a minute and then refresh the GUI. This may also occur during security certificate update for group or array name changes or management ip and discovery ip changes. Wait a minute and then refresh the GUI. In some cases, you may also need to clear browser cache. If the service does not become reachable in a few minutes, contact HPE Nimble Storage Support.
Lösung
Es sieht so aus, als ob die Boot-Devices auf den aktiven (!) Controllern manchmal eine Zeitüberschreitung veraursachen. Das verursachte dann den Dienstfehler „Storage services has become unreachable“.
Dies kann man in den allermeisten Fällen durch einen Neustart des Controllers beheben – also durch einen einfachen Failover. Normalerweise kann man das im Web-GUI mit dem Button „Make active“ tun, was in diesem Fall aber ebenfalls nicht funktioniert.
Es hilft aber den Failover auf den anderen Controller an der SSH-Shell zu erzwingen:
failover --array <ARRAYNAME> --force
Und nach wenigen Minuten ist der Failover fertig, der Controller frisch neu gebootet und das Update läuft ohne Probleme durch.