Auf den Speichersystemen am Standort CARL werden neue Zertifikate eingespielt. Dies betrifft ausschließlich Serverplan F und sollte keine Auswirkungen auf den laufenden Backup-Betrieb haben.
Aufgrund von Problemen mit der Klimaanlage an einem Standort ist der Serverplan C aktuell gestört. An einer Entstörung wird bereits gearbeitet.
Der Serverplan C konnte wieder freigegeben werden.
Zurzeit ist der Single Sign-On und die Multifaktorauthentifizierung sporadisch gestört. Wir arbeiten bereits an einer Lösung und bitten um Geduld. ---english--- At the moment, single sign-on and multi-factor authentication are sporadically disrupted. We are already working on a solution and ask for your patience.
Derzeit kann es auf allen Serverplänen zur Beeinträchtung und Störung von Restores und Synthetic Full Backups kommen. Grund dafür sind nicht verfügbare Datensätze auf den Backup-Speichersystemen. Es wird derzeit mit dem Hardwarehersteller Hitachi nach der Ursache gesucht.
Gestern konnte erfolgreich der Re-Build Prozess auf den HCP Clustern, welcher die Datensätze wiederherstellt, erfolgreich beendet werden. Restores und Synthetic Fulls sollten nun wieder störungsfrei möglich sein.
Durch den Stromausfall am 15.11 sind die Storagesysteme an zwei Standorten aktuell nicht erreichbar. Dazu kommt es zu Problemen bei der Nutzung der Sereverpläne C und E.
Es kommt auch zu Problemen bei Serverplan F.
Wir konnten heute im Laufe des Tages erfolgreich die S31-Speichersysteme in den Standorten Eon und VKA neustarten. Auf einer S31 im Eon läuft gegenwärtig noch ein Re-Build Prozess, um durch den Ausfall entstandene Fehler zu korrigieren. Aus diesem Grund steht der Serverplan C noch voraussichtlich bis morgen Vormittag nicht zu Verfügung. Der Serverplan E jedoch steht nun wieder zu Verfügung und sollte ohne Probleme nutzbar sein. Im Carl sind diverse Systeme noch weiterhin offline. Dies betrifft jedoch nur Serverplan F, welcher noch nicht genutzt wird. Wir machen morgen hier weiter und geben gegebenenfalls Serverplan C wieder frei.
Aktuell laufen die Arbeiten an einer HCP an einem Standort. Dieser liegt der Serverplan C zugrunde und ist folglich noch gestört. Gemeinsam mit dem Hardware-Hersteller wird intensiv an der Behebung gearbeitet.
Der Serverplan C ist wieder freigegeben. Allerdings kann es bei Synthetic Full Backups und Restores noch zu zu Fehlern kommen. Reguläre Backups (inkrementell) sollten über Serverplan C jedoch wieder eingeliefert werden.
Aufgrund einer Störung werden die Dienste auf dem Backupserver commserve1 neugestartet. Dadurch müssen alle laufenden Backupjobs pausiert werden. Währenddessen können keine neuen Backupjobs gestartet werden. Die Erreichbarkeit von console1.dasi.rwth-aachen.de ist davon unberührt.
Aufgrund einer einer Wartung auf der CommCell wird diese um 14:45 Uhr neugestartet. Ab 14:30 Uhr wird der Dienst nicht oder nur teilweise für ca. 1 Stunde erreichbar sein.
Aufgrund einer Störung der der CommCell wird diese neugestartet. Innerhalb der nächsten halben Stunde wird der Dienst nicht oder nur teilweise erreichbar sein.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein Blackoutwindow im Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Für eine kurze zeit gab es einen Fehler bei der Anmeldung über RWTH Single Sign-On kommen: Internal Server Error Das Problem konnte behoben werden. ---English--- For a short period of time, there was an error while using RWTH Single Sign-On. The problem has been solved.
Aktuell kommt es zu Problemen im Backup System, weshalb gegenwärtig keine Backups laufen. Wir arbeiten derzeit mit Hochdruck an der Lösung des Problems.
Das Problem konnte gelöst werden und Backups sollten um 18:00 wieder anlaufen.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein Blackoutwindow im Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Aufgrund von dem abgelaufenen Zertifikat für idm.rwth-aachen.de können keine IdM-Anwendungen und die Anwendungen, die über RWTH Single Sign-On angebunden sind, aufgerufen werden. - Beim Aufrufen von IdM-Anwendungen wird eine Meldung zur unsicheren Verbindung angezeigt. - Beim Aufrufen von Anwendungen mit dem Zugang über RWTH Single Sign-On wird eine Meldung zu fehlenden Berechtigungen angezeigt. Wir arbeiten mit Hochdruck an der Lösung des Problems. --- English --- Due to the expired certificate for idm.rwth-aachen.de, no IdM applications and the applications that use RWTH Single Sign-On can be accessed. We are working on a solution. - An insecure connection message is displayed when calling up IdM applications. - When calling up applications with access via RWTH Single Sign-On, a message about missing authorisations is displayed.
Das Zertifikat wurde aktualisiert und die Anwendungen können wieder aufgerufen werden. Bitte löschen Sie den Browsercache, bevor Sie die Seiten wieder aufrufen. /// The certificate has been updated and the applications can be accessed again. Please delete the browser cache before accessing the pages again.
Aufgrund einer Störung der der CommCell wird diese neugestartet. Innerhalb der nächsten halben Stunde wird der Dienst nicht oder nur teilweise erreichbar sein.
Aufgrund einer Störung der der CommCell wird diese neugestartet. Innerhalb der nächsten halben Stunde wird der Dienst nicht oder nur teilweise erreichbar sein.
Der Neustart wurde erfolgreich durchgeführt. Alle Commvault Dienste sollten nun wieder einwandfrei funktionieren.
Aktuell sind die Reaktionszeiten von console1 und console2 sehr langsam. Die Analyse läuft bereits und wir hoffen, dass das Problem schnell behoben werden kann. Backups sollten von dem Problem nicht betroffen sein.
Aufgrund einer Störung der MongoDB Datenbank des CommCell wird dieser neugestartet. Innerhalb der nächsten halben Stunde wird der Dienst nicht oder nur teilweise erreichbar sein.
Um 10:00 wird es eine Reparatur und Neustart der MogoDB auf dem CommServe geben. Dadurch wird die Erreichabrkeit von console1.dasi.rwth-aachen.de und console2.dasi.rwth-aachen.de beeinträchtigt. Wir erwarten eine Beeinträchtigung von unter 5 Minuten.
Aufgrund einer Störung des DNS liefern die Nameserver verschiedener Provider aktuell keine IP-Adresse für Hosts unter *.rwth-aachen.de zurück. Als Workaround können Sie alternative DNS-Server in Ihren Verbindungseinstellungen hinterlegen, wie z.B. die Level3-Nameserver (4.2.2.2 und 4.2.2.1) oder von Comodo (8.26.56.26 und 8.20.247.20). Ggf ist es auch möglich den VPN-Server der RWTH zu erreichen, dann nutzen Sie bitte VPN. // Due to DNS disruption, the name servers of various providers are currently not returning an IP address for hosts under *.rwth-aachen.de. As a workaround, you can store alternative DNS servers in your connection settings, e.g. the Level3-Nameserver (4.2.2.2 and 4.2.2.1) or Comodo (8.26.56.26 und 8.20.247.20). It may also be possible to reach the RWTH VPN server, in which case please use VPN.
Anleitungen zur Konfiguration eines alternativen DNS-Server unter Windows finden Sie über die folgenden Links: https://www.ionos.de/digitalguide/server/konfiguration/windows-11-dns-aendern/ https://www.netzwelt.de/galerie/25894-dns-einstellungen-windows-10-11-aendern.html Als Alternative können Sie auch VPN nutzen. Wenn Sie den VPN-Server nicht erreichen, können Sie nach der folgenden Anleitung die Host-Datei unter Windows anpassen. Dadurch kann der Server vpn.rwth-aachen.de erreicht werden. Dazu muss der folgenden Eintrag hinzugefügt werden: 134.130.5.231 vpn.rwth-aachen.de https://www.windows-faq.de/2022/10/04/windows-11-hosts-datei-bearbeiten/ // Instructions for configuring an alternative DNS server under Windows can be found via the following links: https://www.ionos.de/digitalguide/server/konfiguration/windows-11-dns-aendern/ https://www.netzwelt.de/galerie/25894-dns-einstellungen-windows-10-11-aendern.html You can also use VPN as an alternative. If you cannot reach the VPN server, you can adjust the host file under Windows according to the following instructions. This will allow you to reach the server vpn.rwth-aachen.de. To do this, the following entry must be added: 134.130.5.231 vpn.rwth-aachen.de https://www.windows-faq.de/2022/10/04/windows-11-hosts-datei-bearbeiten/
Die Host der RWTH Aachen sind nun wieder auch von ausserhalb des RWTH Netzwerkes erreichbar. // The hosts of RWTH Aachen University can now be reached again from outside the RWTH network.
Auch nach der Störungsbehebung am 25.8. um 21 Uhr kann es bei einzelnen Nutzer*innen zu Problemen gekommen sein. Am 26.8. um 9 Uhr wurden alle Nacharbeiten abgeschlossen, sodass es zu keinen weiteren Problemen kommen sollte. // Individual users may have experienced problems even after the fault was rectified on 25 August at 9 pm. On 26.8. at 9 a.m. all follow-up work was completed, so there should be no further problems.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein kurzfristiges Blackoutwindow Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Derzeit kommt es zu Problemen mit den Backend-Speichersystemen. Dadurch kommt es zu Störungen bei laufenden Backup-Jobs. Restores können ebenfalls betroffen sein. Wir arbeiten derzeit mit unserem Hardware-Vendor Hitachi an einer Lösung.
Aufgrund von Replikationsproblemen auf den Speichersystemen kann es zur Verzögerungen beim Abarbeiten der Backup-Jobs kommen.
Die Replikationsprobleme konnten inzwischen gelöst werden, so dass die Backups wieder normal abgearbeitet werden.
Momentan ist die Anmeldung auf der console1.dasi.rwth-aachen.de gestört. Als alternative Login-Möglichkeit kann die console2.dasi.rwth-aachen.de verwendet werden. Backup und Restore Jobs laufen ohne Probleme weiter.
Die console1.dasi.rwth-aachen.de ist nun wieder verfügbar.
Während der Teilwartung am Dienstag, dem 30.Juli 2024, werden die IndexDatenbanken des MediaAgents Ma-12 rekonfiguriert. Aus diesem Grund stehen Backup und Restores auf dem Serverplan B im Zeitraum zwischen 11:00 Uhr und 13:00 Uhr nicht zur Verfügung. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt.
Die console1.dasi.rwth-aachen.de ist nun wieder verfügbar.
Derzeit kommt es zu Störungen bei den Serverplänen E und F. Der Speichersysteme der Serverpläne Für Clients, die diese Serverpläne ausgewählt haben, werden laufende Jobs pausiert und geplante Jobs verschoben. Wir arbeiten derzeit zusammen mit Hitachi an einer Lösung.
Serverplan E ist wieder störungsfrei
Serverplan F ist nun auch wieder störungsfrei
Update der Switche für die DASI-Infrastruktur. Die Switche werden im HA-Verbund rebootet, dabei sollte es zur keiner Unterbrechung der Services kommen
Momentan ist die Anmeldung auf der Console1.dasi.rwth-aachen.de gestörrt. Als alternative Login-Möglichkeit kann die Console2.dasi.rwth-aachen.de verwendet werden. Backup und Restore Jobs laufen ohne Probleme weiter.
Die console1.dasi.rwth-aachen.de ist nun wieder verfügbar.
---english version below--- Seit dem 2. Juli 2024 ist der RWTH Single Sign-On (SSO) und hiermit der Login aller SSO-angebundener Services mit einer Multifaktor-Authentifizierung geschützt. Nutzende müssen neben einem individuellen Kennwort von nun an einen weiteren Sicherheitsfaktor beim Login angeben. Den zweiten Faktor müssen Sie im Selfservice [1] über den Tokenmanager generieren. Weitere Informationen finden Sie auf IT Center Help [2] und dem IT Center Blog [3]. ---english version--- Since July 2, 2024, the RWTH Single Sign-On (SSO) and the login of all SSO-connected services is protected with multifactor-authentication (MFA). In addition to an individual password, users must now enter a second factor when logging in. The second factor must be generated in Selfservice [1] via the Token Manager. Further information can be found on IT Center Help [2] and the IT Center Blog [3]. [1] http://www.rwth-aachen.de/selfservice [2] https://help.itc.rwth-aachen.de/service/0f861f53818c44e9a5df6ea7b244dacd/article/b084004d1bcf40a3be00f456f3e4a543/ [3] https://blog.rwth-aachen.de/itc/en/tag/mfa/
Während der Teilwartung wird die Keycloak Anbindung der neuen Console1 durchgeführt. Während dieser Zeit laufen alle Backups und Restores ohne EInschränkungen weiter. Die Console1 und Console2 stehen während dieser Zeit jedoch nicht zur Verfügung.
Da die Index-Datenbank des Mediaservers Ma-12 vollgelaufen ist, ist der Mediaagent offline. Jobs des Serverplans B laufen normal auf anderen MediaAgents weiter. In einigen Fällen kann es zu entsprechenden Fehlermeldungen kommen. Gegebenenfalls kann es bei Restore Jobs, die auf die auf die Index-Datenbank des Mediaagents Ma-12 zugreifen zu Fehlern oder zu längeren Durchführungszeiten kommen. Wir arbeiten gemeinsam mit dem Commvault-Support an einer Lösung.
Das Problem wurde leider noch immer nicht behoben. WIr arbeiten derzeit schnellstmöflich an einer Lösung des Problems.
Leider konnte die Index Datenbank durch den Load Balancing Prozess bisher noch nicht wieder freigeräumt werden. Der Prozess wird vorraussichtlich bis Montag, dem 8.Juli andauern.
Für die ursprünglich am 25.06.2024 geplante Wartung wurde ein neuer Termin angesetzt. Im angegebenen Zeitraum wird das System console1.dasi.rwth-aachen.de mit einem neuen Betriebssystem auf neuer virtueller Hardware neu aufgesetzt. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
--English Version Below-- Aktuell ist der Login über den RWTH Single Sign-On und somit in die dahinter eingebundenen Services leider nur in Einzelfällen erfolgreich. Bitte versuchen Sie im Falle einer Fehlermeldung den Login in ca. einer Stunde erneut. Personen, die bereits erfolgreich eingeloggt sind, sind von der Störung nicht betroffen. --English Version-- Unfortunately, the login via the RWTH Single Sign-On and thus into the connected services is currently only successful in individual cases. If you receive an error message, please try to log in again in about an hour. People who are already successfully logged in are not affected by the disruption.
Die Server sind aktuell ausgelastet. Wir bitten Sie deshlab weiterhin, den Login erst zu einem späteren Zeitpunkt (ca. in einer Stunde) zu versuchen. Wir arbeiten an einer nachhaltigen Lösung des Problems. // The servers are currently at full capacity. We therefore ask you to try to log in at a later time (approx. in one hour). We are working on a solution to the problem.
Durch diverse Maßnahmen, die insgesamt die Performanz der Server deutlich erhöhen haben, wurden die Ladeschwierigkeiten und Loginprobleme gegen 15 Uhr behoben. Die Meldung bleibt vorerst als Hinweis bestehen, da wir die Last des Systems weiterhin beobachten. // Through various measures, which have significantly increased the overall performance of the servers, the loading difficulties and login problems were resolved around 3 pm. For the time being, the message remains as a note, as we continue to monitor the load on the system.
Der Login in den RWTH Single Sign-On ist stabilisiert. Aus dem Grund beenden wir den Hinweis. // The login to the RWTH Single Sign-On is stabilized. For this reason, we are ending this notice.
Aufgrund einer Störung des Serverplans B werden die MediaAgents Ma-04, Ma-07, Ma-09 und Ma-12 neugestartet. Nach dem Neustart sollten alle Jobs betrffend des Serverplan B wieder ordnungsgemäß laufen.
Im angegebenen Zeitraum wird das System console1.dasi.rwth-aachen.de mit einem neuen Betriebssystem auf neuer virtueller Hardware neu aufgesetzt. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Aufgrund eines Softwareupdates, der S31-Libarys im Kop6, kann es gegebenenfalls zwischen 12:00 und 14:00 zu einer Pausierung der Backup- und Restore Prozesse kommen. Diese werden anschließend wieder fortgesetzt.
Wegen eines wichtigen Software-Updates steht kurzzeitig die Console1.dasi.rwth-aachen.de nicht zu Verfügung. Als alternative Login-Möglichkeit kann die Console2.dasi.rwth-aachen.de verwendet werden. Auf laufende Backup- und Restore-Prozesse sollte diese Teilwartung keinen Einfluss haben.
Leider ist auch die alternative Login-Möglichkeit über die Console2.dasi.rwth-aachen.de betroffen. Ein Login auf die Commvault Oberfläche ist daher im Zeitraum der Wartung nicht möglich.
Wir konnten das Software-Update auf der Console1 erfolgreich durchführen. Jedoch ist der Login auf der Console1 leider noch immer nicht möglich. Allerdings funktioniert der alternative Login über die Console2 wieder. Wir bitten daher für den Zeitraum der Wartung den Login über die Console2.dasi.rwth-aachen.de zu verwenden.
Im angegebenen Zeitraum wird das Systeme console2.dasi.rwth-aachen.de mit einem neuen Betriebssystem auf neuer virtueller Hardware neu aufgesetzt.
Neustart der Commcell. Aktuell kommt es zu einem Problem in der Commcell, so dass die Services auf dem System neugestartet werden müssen.
Im Zuge dieser Störung haben wir die Commserve1 neustarten müssen, wodurch die Störung behoben wurde. Alle Backup-Jobs sollten nun wieder ordnungsgemäß durchlaufen.
Aktuell kommt es zu einem Problem in der Commcell, so dass die Services auf dem System neugestartet werden müssen
Der Neustart der Services hat leider nicht funktioniert, so dass der Server komplett rebootet werden muss.
Der Neustart des Servers hat die Probleme gelöst und die Backups laufen wieder. Wir bitten die Störung zu entschuldigen.
Aufgrund eines abgelaufenen Serverzertifikats auf dem Keycloak ist momentan die Anmeldung auf der console1.dasi.rwth-aachen.de gestört. An einer Ĺösung wir bereits gearbeitet. Backupjobs sind von der Störung nicht betroffen und die Sicherungen laufen wie geplant weiter.
Das Zertifikat wurde bisher noch nicht ausgestellt. Deswegen haben wir den Zeitraum der Teilstörung verlängert.
Neues Zertifikat wurde eingespielt.
In dieser kurzfristigen Wartung werden im Commvault System die Cloud Access Pfade angepasst, um die System Performance zu verbessern. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein kurzfristiges Blackoutwindow Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
***English Version below*** Aktuell gibt es Probleme mit der Anmeldung an Console1.dasi.rwth-aachen.de für RWTH Backup-Admins An einer Ĺösung wir bereits gearbeitet. Backupjobs sind von der Störung nicht betroffen. Die Sicherungen laufen wie geplant weiter. ***English Version*** There are currently problems with logging in to Console1.dasi.rwth-aachen.de for RWTH backup admins We are already working on a solution. Backup jobs are not affected by the disruption. The backups continue to run as planned.
Störung wurde behoben
Aktuell kommt es im Backup-System zu deutlichen Verzögerungen in der Abarbeitung der Backup- und Restore-Jobs. Commvault ist bereits an der Analyse des Problems und wir hoffen auf eine Lösung des Problems im Laufe des Nachmittags.
Leider konnte das Problem auch weiterhin nicht behoben werden. Wir hoffen auf eine Lösung bis heute Abend.
Leider konnte das Problem heute nicht mehr behoben werden. Wir hoffen, das Problem bis einschließlich Montag zu beheben. Wir bitten entstandene Unannehmlichkeiten zu entschuldigen.
Die Situation hat sich inzwischen wieder stabilisiert. Die blockierenden Prozesse konnten beendet werden und die Backups laufen wieder.
Es findet in der angegebenen Zeit eine Wartung des Keycloak Servers für Commvault statt, so dass in dieser Zeit keine Anmeldung an der Webkonsole von Commvault möglich ist. Backups laufen wie gewohnt weiter.
Wegen einer wichtigen Hardware-Wartung unseres Speicher-Backends im Kop6 wird es ein kurzfristiges Blackoutwindow im Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Leider verzögern sich die Harwarearbeiten im Storagesystem, sodass die Hardwarewartung verlängert werden muss.
Bedauerlicherweise verzögern sich die Hardwarearbeiten weiterhin. Wir bitten den Ausfall zu entschuldigen. Wir hoffen, dass bis 21 Uhr die Arbeiten abgeschlossen sind.
Die Komplikationen bei der Hardwarewartung konnten heute leider nicht abgeschlossen werden, so dass die Arbeiten orgen früh fortgeführt werden müssen. Das Wartungsfenster wurde daher bis Morgen 11:00 verlängert.
Leider konnten die Reparaturen am Storage System noch nicht abgeschlossen werden. Um den Backup Betrieb nicht weiter zu behindern wurde das Blackout Window dennoch geschlossen, sodass die Sicherungen der Clients jetzt wieder möglich sein sollten. Da das besagte Storage System noch nicht verfügbar ist, kann es bei Restores zu Fehlermeldungen bzgl. nicht verfügbarer Objekte kommen. An der Reparatur des Storage Systems wird weiter mit Hochdruck gearbeitet. Wir bitten die Unanehmlichkeiten zu entschuldigen.
Leider ließen sich die Probleme am Storage System bisher noch nicht beheben, aufgrund weiterer Komplikationen. Das Ticket dazu wurde auf internationalen Sev 1 Level angehoben und hat damit höchste Priorität beim internationalen Support. An der Reparatur des Storage Systems wird weiter mit Hochdruck gearbeitet. Das Sichern der Clients ist weiterhin gewährleistet. Allerdings kann es bei Restores auch weiterhin zu Fehlermeldungen bzgl. nicht verfügbarer Objekte kommen, da das Storage System noch nicht wieder verfügbar ist. Wir bitten die Unanehmlichkeiten und die weitere Verzögerung zu entschuldigen.
Die Probleme am dem Storage System wurden heute behoben und das System ist nun wieder Read/Write fähig. Die Restores sollten nun wieder ordnungsgemäß funktionieren. Wir bitten die entstandenen Unanehmlichkeiten und Verzögerungen zu entschuldigen.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein kurzfristiges Blackoutwindow Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Aktuell gibt es Verbindungsprobleme mit dem Backup-Portal. Wir arbeiten bereits an einer Lösung. ---english--- There are currently connection problems with the backup portal. We are already working on a solution.
Die Störung wurde behoben. ---english--- The problem has been resolved.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein kurzfristiges Blackoutwindow Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Da die Index-Datenbank des Mediaservers ma-16 vollgelaufen ist und automatische Prozesse in Commvault, die zur Bereinigung dienen nicht ordnungsgemäß funktionieren, ist der Mediaagent offline. Jobs des ServerplansD laufen normal auf anderen Mediaagents weiter. In einigen Fällen kann es zu entsprechenden Fehlermeldungen kommen und gegebenenfalls bei Restore Jobs, die auf die auf die Index-Datenbank des Mediaagents ma-16 zugreifen zu Fehlern oder zu längeren Durchführungszeiten. Wir arbeiten gemeinsam mit dem Commvault-Support an einer Lösung.
Der Login ins Commandcenter per console1.dasi.rwth-aachen.de (per SSO) ist aktuell nicht möglich, wir arbeiten an der Behebung der Störung.
Der Login funktioniert wieder. Einige Prozesse, die keine Reaktion mehr zeigten, konnten durch Neustarts der beteiligten Systeme wieder in Gang gebracht werden.
Der Mediaagent ma-03 ist offline, wir arbeiten an der Behebung der Störung. Es sind aktuell keine Einschränkungen von Backups- und Restore-Jobs dadurch zu erwarten.
Der Fehler konnte behoben werden und der Mediaagent ist wieder online.
Um einige wichtige Updates und Fixes auf den Commvault-Systemen zu installieren wird es ein kurzfristiges Blackoutwindow Commvault System geben. Laufende Backup- und Restore-Prozesse werden in der Regel automatisch pausiert und wieder fortgesetzt. In dem Zeitraum der Wartung werden die DaSi-Systeme für Nutzer temporär nicht erreichbar sein.
Die Wartung wurde erfolgreich durchgeführt, der Commserve ist nun auf Version 11.32.23
Da die Index-Datenbank des Mediaservers ma-09 vollgelaufen ist und automatische Prozesse in Commvault, die zur Bereinigung dienen nicht ordnungsgemäß funktionieren, ist der Mediaagent offline. Jobs des ServerplansB laufen normal auf anderen Mediaagents weiter. In einigen Fällen kann es zu entsprechenden Fehlermeldungen kommen und gegebenenfalls bei Restore Jobs, die auf die auf die Index-Datenbank des Mediaagents ma-09 zugreifen zu Fehlern oder zu längeren Durchführungszeiten. Wir arbeiten gemeinsam mit dem Commvault-Support an einer Lösung.
Wir arbeiten weiterhin mit den Herstellern an einer dauerhaften Lösung. Bisherige Lösungsansätze waren nur kurzfristig erfolgreich bzw. die Erfolge werden noch bis zum Ende von Verschiebe-Prozessen voraussichtlich noch einige Tage Zeit in Anspruch nehemen.
Der Mediaagent ma-09 ist nach Hard- und Softwareanpassungen wieder im Normalbetrieb.
Da ein DIMM-Modul getauscht werden soll, der laut Vorhersagen ausfallgefährdet ist, wird ein Mediaagent (ma-04, ServerplanB) für die Dauer des Tausches abgeschaltet. Außerdem werden Arbeiten an der Stromversorgung durchgeführt, die voraussichtlich keine Störung verursachen werden.
Die Administration von Backup- und Restorejobs ist über console1.dasi.rwth-aachen.de nicht möglich, nach dem Login per SSO wird eine leere Seite angezeigt. Wir arbeiten an einer Lösung und erwarten, dass nach dem Restart der Dienste der Login in Kürze wieder möglich sein wird.
Der Fehler wurde gefunden und behoben.
Aufgrund von Maßnahmen zu Problembehebungen und Erweiterungen von Hardware-Komponenten kommt es in den letzten Tagen häufiger zu Systemmeldungen der Form "Failed to mount the disk media in library ... with mount path ... on MediaAgent .... [Cloud] There is a slow down error." Die Hersteller der Soft- und Hardware arbeiten gemeinsam unter Hochdruck an einer Lösung. Sollten Restores von einzelnen Dateien, Ordnern oder Systemen fehlschlagen, empfielt es sich diese Jobs nach einiger Zeit erneut zu starten.
Commvault Backups: Hitachi arbeitet weiterhin an einer Lösung um die Ursache für "failt to mount" und "slow down" Meldungen zu beseitigen.
Bei den Hitachi HCP Clustern müssen unregelmäßig Neustarts Seitens Hitachi ausgeführt werden. Bei den Umkonfigurationen, die zur Fehlerbehebung dienen sollen, fallen die Systeme gelegentlich in "Read-Only-Status". Es tauchen dadurch unterschiedliche Fehlermeldungen bei Commvault Jobs auf - auch wenn diese häufig Unterbrochen werden, werden sie regelmäßig bis zum Ende (completed/committed oder failed) automatisch fortgesetzt (running/waiting).
Die Hersteller arbeiten weiter an der Lösung identifizierter Probleme. Aktuell treten gelegentlich Meldungen der Art "....Error occurred in Disk Media, Path [hcp...../CV_MAGNETIC/V_123456][Check whether the path[hcp..../CV_MAGNETIC/V_123456] is Accessible.] ....." auf - die Analyse der Logs dazu Seitens der Hersteller läuft bereits.
Nach den eingespielten Software-Updates beobachten wir eine Verbesserung. Wir beobachten die Systeme gemeinsam mit den Herstellern weiterhin und werden berichten, falls erneut Auffälligkeiten auftreten.
In der Wartung werden die Hitachi Content Plattform Speichersysteme an sechs Standorten auf eine neue Softwareversion aktualisiert. Aufgrund der Kritikalität des Upgrades haben wir uns nach sorgfältiger Abwägung dazu entschlossen, das Upgrade auf allen Teilen des Systems in einer Wartung und nicht im laufenden Betrieb durchzuführen. Das System wird hierfür für insgesamt drei Tage offline gehen: Die Wartung beginnt am 26. September 2023 morgens um 6:00 Uhr und endet planmäßig am 28. September um 17:00 Uhr. Bitte beachten Sie, dass in dieser Zeit weder die Einlieferung neuer Backup-Daten in das System noch das Wiederherstellen von Daten aus dem Backup möglich sein wird. Zur Vorbereitung und Durchführung der Wartung besteht Ihrerseits kein direkter Handlungsbedarf. Sollten Ihre dort gesicherten Anwendungen (z. B. Datenbanksysteme) allerdings ein regelmäßiges Backup innerhalb eines festen Zeitfensters zwingend erfordern, sollten Sie für den Zeitraum der Wartung nach alternativen Sicherungsmöglichkeiten suchen. Nach Beendigung der Wartung werden Ihre Backup-Prozesse automatisch zu den planmäßig eingestellten Uhrzeiten wieder anlaufen. Der DaSi Lizenzserver ist von der Wartung nicht betroffen und wird während der Wartung zur Verfügung stehen. Wir bitten die Unannehmlichkeiten, die durch das lange Wartungsfenster entstehen, zu entschuldigen. ---------------- During maintenance, Hitachi Content Platform storage systems at six sites will be upgraded to a new software version. Due to the criticality of the upgrade, after careful consideration, we have decided to perform the upgrade on all parts of the system during maintenance rather than during live operations. The system will go offline for a total of three days to do this: Maintenance will begin at 6am on September 26 and will end as scheduled on September 28, 2023 at 5pm. Please note that it will not be possible to submit new backup data to the system or restore data from the backup during this time. No direct action is required on your part to prepare for and perform the maintenance. However, if your applications backed up there (e.g. database systems) require a regular backup within a fixed time window, you should look for alternative backup options for the duration of the maintenance. After the maintenance is finished, your backup processes will automatically restart at the scheduled times. The DaSi license server is not affected by the maintenance and will be available during the maintenance. We apologize for any inconvenience caused by the long maintenance window.
Hiermit erinnern wir Sie an die anstehende Wartung des Commvault Backupsystem vom 26. September bis zum 28. September 2023 // We hereby remind you about the upcoming maintenance of the Commvault backup system from September 26 to September 28, 2023
Der Upgrade des Speicher-Backends konnte erfolgreich durchgeführt werden. Nach erfolgreichen Tests des Gesamtsystems steht dieses ab jetzt wieder zur Verfügung. Ab 18:00 werden die planmäßigen Sicherungen der Systeme wieder wie gewohnt starten. Wir bedanken und für die Geduld während der Wartung und bitten nochmal die entstandenen Unannehmlichkeiten zu entschuldigen.
Um einige wichtige Updates und Fixes zu installieren wird ein Blackout Window im Commvault System eingestellt. In dem Zeitraum der Wartung werden keine Backup- und Restore-Jobs möglich sein. Zuvor gestartete, laufende Backup- und Restore-Prozesse werden automatisch pausiert und wieder fortgesetzt.
Aufgrund von laufenden Wiederherstellungsprozessen der Dedup Datenbanken von ServerplanD, die nicht unterbrochen werdn können wird die geplante Wartung vom 17.08. auf den 23.08.23 verschoben.
Wegen laufender automatischer Commvault-Prozesse, die länger dauern als gewöhnlich, sind die Dedup-Datenbanken des ServerplanD offline. Daher sind akuell keine Backup- und Restore Jobs möglich. Wir arbeiten gemeinsam mit Commvault an einer Lösung.
Die automatische Wiederherstellung der Dedup Datenbank dauert aufgrund der sehr großen Menge der Einträge noch an und wird vermutlich noch bis morgen andauern.
Da die Prozesse zur Wiederherstellung länger dauern als erwartet, wurde die geplante Wartung der Commvault-Systeme auf den 23.08.23 verschoben. Es können weiterhin keine Backup- und Restore-Prozesse auf ServerplanD durchgeführt werden, bis die Dedup Datenbank wiederhergestellt wurde. Für Backups ist es möglich in dringenden Fällen Clients von ServerplanD auf ServerplanE umzustellen und eine Vollsicherung anzustoßen.
Die Dedup Datenbank-Partitionen des Mediaagent Grids, auf dem ServerplanD läuft, wurden heute früh erfolgreich wiederhergestellt. Die laufenden Jobs werden wieder abgearbeitet, es gibt möglicherweise noch Warteschlangen, die sich nach und nach auflösen werden.
Ab Dienstag, 17.01.2023, ist das TSM-Backup-System nur noch im "Read Only"-Modus verfügbar. Backups werden ab dem 17.01. nur noch über das Commvault-Backup-System entgegengenommen. Der Parallelbetrieb der Backup-Systeme wird damit beendet. Details zum Commvault-Backup-System erhalten Sie auf IT Center Help https://help.itc.rwth-aachen.de/service/t4ctl3msqrmt/article/0c39665e06364621bd17be42d1890a06/ Sowie im IT Center Blog: https://blog.rwth-aachen.de/itc/2022/11/18/tsm-backup-read-only/
Zur Zeit kann es zu Fehler bei Restoreoperationen im Commvault Backup System kommen.
Es kommt vereinzelt zu Zugriffsfehlern auf ein Speichersystem des Cummvault Backup Services. Weitere Analysen laufen.
Commvault: Aufgrund der Störung können Backup-Jobs längere Laufzeiten als sonst haben und temporär Startverzögerungen durch Warteschlangen auftreten. An der Analyse und Behebung wird weiter gearbeitet.
Einige Fehler sind behoben, so dass Jobs wieder schneller abgearbeitet werden können und die Warteschlangen abgebaut werden. Die Ursachen-Analyse läuft weiter.
Wir sind weiter im Austausch mit Hard- und Software-Herstellern und versuchen Lösungen für die noch einzeln auftretenden Fälle zu finden.
Es werden weiterhin Probleme bei Restore-Versuchen beobachtet. Diese stehen höchstwahrscheinlich mit den Replikationsproblemen des Speichers in Zusammenhang, an deren beseitigung der Hersteller weiterhin mit Hochdruck arbeitet. Gestartete Inkrementelle Backup-Jobs werden teilweise automatisch in Vollsicherungen umgewandelt, da die Daten aus dem gleichen Grund nicht (oder nicht ausreichend schnell genug) verifiziert werden.
Bitte verfolgen Sie für aktuelle Hinweise die Störungsmeldung von 01.06.2023
Aufgrund kurzfristiger Wartungsarbeiten werden Commvault Jobs pausiert - Hitachi HCP Cluster müssen nach Konfiguratuinsanpassungen zur verhinderungen der "Slow-Down-Meldungen" neu gestartet werden.
Das Commvault Blackoutfenster wurde beendet, so dass Backup- und Restore-Jobs wieder laufen können.
Da der Hersteller der Storagesysteme an einem DaSi-Standort Wartungsarbeiten durchführen wird, können temporär Backup- und Restore-Dienste innerhalb des Zeitraums dieser Arbeiten länger dauern.
Da der Hersteller der Storagesysteme Wartungsarbeiten durchführen wird, werden temporär Backup- und Restore-Dienste pausiert. Laufende Jobs werden angehalten und automatisch fortgesetzt. Wir versuchen die "Blackout-Fenster" so klein wie möglich zu halten.
Da der Hersteller der Storagesysteme Wartungsarbeiten durchführen wird, werden temporär Backup- und Restore-Dienste pausiert. Laufende Jobs werden angehalten und automatisch fortgesetzt. Wir versuchen die "Blackout-Fenster" so klein wie möglich zu halten.
Um einige wichtige Updates und Fixes zu installieren wird es ein kurzfristiges Blackoutwindow Commvault System geben. Laufende Backup- und Restore-Prozesse werden automatisch pausiert und wieder fortgesetzt.
Zur Zeit ist der Login in das Commvault web Interface (console1.dasi.rwth-aachen.de) gestört. Wir abrieten an der Problemlösung
--english version below-- Commvault: Aufgrund von geplanten Wartungsarbeiten (Kühlsysteme /Spannungsversorgung) werden einige DaSi-Systeme vorsorglich heruntergefahren. Durch das abschalten der Systeme erwarten wir keine Beeinträchtigung des Gesamtsystems. Es kann bei ungeplanten Ausfällen weiterer Systeme zu Einschränkungen bei Backup- und Restore-Jobs kommen. --english version-- Commvault: Due to planned maintenance work (cooling systems / power supply), some DaSi systems will be shut down as a precaution. We do not expect any impact on the overall system due to the shutdown of the systems. There may be restrictions in backup and restore jobs in case of unplanned downtime of further systems.
Die Arbeiten im C.A.R.L. wurden abgeschlossen, die Systemen arbeiten wieder normal.
Aufgrund eines Zertifikatstausch, kann es zu kurzzeitigen Unterbrechungen beim Login in das Commvault Portal (console1.dasi.rwth-aachen.de) kommen.
Uns erreichen vermehrt Meldungen zu Loginproblemen bei Commvault. Der Anmeldeversucht läuft nicht durch, er resultiert in einer Single Sign-On-Dauerschleife. Die zuständige Fachabteilung wurde bereits informiert. --- english --- We are receiving reports of login problems with Commvault. The login attempt does not go through, it results in a single sign-on continuous loop. The responsible specialist department has already been informed.
In der Commvault Weboberfläche (Commandcenter) funktionieren aktuell das Sortieren, Suchen, Filtern nicht. Ebenso ist ein Umblättern auf eine nächste Seite bei der Pagination teilweise nicht möglich. Der Software-Hersteller analysiert das Problem und arbeitet an einer baldigen Lösung.
Ein für die genannten Funktionen erforderlicher Prozess war durch einen Fehler abgestürzt. Der Prozess ist wieder im Gang und die Funktionen (Sortieren, Filtern, Suchen) sind wieder nutzbar.
Uns erreichen vermehrt Meldungen zu Loginproblemen bei Commvault. Der Anmeldeversucht läuft nicht durch, er resultiert in einer Single Sign-On-Dauerschleife. Die zuständige Fachabteilung wurde bereits informiert. --- english --- We are receiving reports of login problems with Commvault. The login attempt does not go through, it results in a single sign-on continuous loop. The responsible specialist department has already been informed.
Aufgrund der Störung des Commvault-Backup-Systems ist ein Reboot des Servers notwendig. An der Behebung der Störung wird gearbeitet.
Die Störung konnte behoben werden. Der Login auf console1 ist wieder möglich.
Commvault: Aufgrund von Wartungsarbeiten (Einspielung von Firmwareupdates und Neustarts) kann es in dem Zeitraum zu Unterbrechungen oder "Blackout Windows" kommen, so dass laufende Jobs pausiert und automatisch fortgesetzt werden. Backup- und Restore-Dienste sind temporär nur eingeschränkt nutzbar.
Ein Teil der Arbeiten, die für den 25.04.23 geplant waren, sind erfolgreich abgeschlossen. am 26.04.23 werden die Arbeiten fortgesetzt.
Die Arbeiten, die für den 25./26.04.23 geplant waren, sind erfolgreich abgeschlossen.
Zur Zeit gibt es Probleme mit dem Login in das Commvault Portal (console1.dasi.rwth-aachen.de). Die äußern sich so, dass man nach dem Login am Singe Sigen On Service wieder zur Commvault Login Seite weitergeleitet wird. Die Backup Funktionalität ist hiervon nicht beeinträchtigt.
Console: commserve1 und console1 werden neu gestartet, die Backup und Restore-Dienste sind kurzzeitig nicht verfügbar.
Der Login über das Commvault Portal (console1.dasi.rwth-aachen.de) funktioniert wieder, die Backup- und Restore-Dienste sind wieder nutzbar.
Zur Zeit liegt eine Hardware Störung im TSM System vor, die zu Problemen bei Backups und Restores führen kann.
Das Hardware Problem wurde behoben
Commvault: Aufgrund Hardware-Aus- und -Umbau-Maßnahmen werden die Backup- und Restore-Dienste innerhalb des "Blackout Windows" temporär nicht zur Verfügung stehen. Zum Startzeitpunkt der Arbeiten laufende Jobs werden automatisch pausiert und später fortgesetzt.
Zur Zeit laufen im Commvault Systeme keine Jobs mehr an. Dies betrifft sowohl Backups als auch Restores. Ein Ticket beim Hersteller wurde bereits eröffnet und die Fehleranalyse läuft.
Der Softwarehersteller hat einen Patch für das aufgetretene Problem zur Verfügung gestellt. Nun laufen alle Operationen wieder. Hierdurch werden die verpassten nächtlichen Backups nun nachgeholt.
Zur Sicherstellung der Betriebs und Fehlerbehebung werden im genannten Zeitraum Updates an zentralen Komponenten des Commvault Backup durchgeführt. Backup, Restore, Sowie die Verwaltungsinterfaces (console1.dasi.rwth-aachen.de) stehen zeitweise nicht zur Verfügung.
Mit den neuen Workflow UnassignClientFromGroup sind berechtigte Personen ab sofort in der Lage eine Gruppenzuordnung im Commvault Backup System wieder aufzuheben. Hierzu sind, wie beim Zuordnen zu Gruppen die Informationen Client FQDN und Client Token nötig. Diese können mit den Skripten ermittelt werden, die im Commvault (Web console -- Download Center) Download Portal zu finden sind.
Commvault: Der Login über console1 ist zur Zeit nicht möglich. Wir arbeiten an der Behebung des Problems.
Commserve1 und Console1 müssen neu gestartet werden, alle laufenden Jobs werden pausiert und nach dem Neustart automatisch fortgesetzt. Die Dienste sind während des Neustarts kurzfristig nicht nutzbar, Logins nicht möglich.
Die Dienste sind wieder nutzbar, Logins sind wieder möglich.
Commvault: Backup-Jobs starten nicht oder zeigen keinen Fortschritt mit der Meldung "Description: Index server is disabled on the Media agent". Betroffen sind Sicherungen auf ServerplanB. Wir arbeiten an einer Fehlerbehebung.
Der Fehler wurde in der Nacht behoben
Im genannten Zeitraum finden kleinere Anpassungen am Authentication Service für das Webinterface des Commvault Backups Statt. Es ist nicht mit Unterbrechungen zu rechnen.
Das Zeitfenster musste angepasst werden
In genannten Zeitraum sind Konfigurationsänderungen auf Zentralen Servern des Commvault Basckup Systems geplant. Hiebe kann es zu kurzen Unterbrechungen in der Dienstverfügbarkeit kommen. Unterbrochene Jobs werden automatisch wieder aufgenommen.
wegen eines dringenden Software Updates, kommt es zu kurzzeitigen Ausfällen einzelner Komponenten des Commvault backup System. Unterbrochene Prozesse (backup, restore) werden nach dem Update fortgesetzt.
Commvault: Der Login über console1 ist zur Zeit nicht möglich. Wir arbeiten an der Behebung des Problems. Da console1 und commserve1 neu gestartet werden müssen, werden die Dienste kurzfristig nicht nutzbar sein.
Der Login und die Nutzung der Commvault-Dienste ist wieder möglich.
Aufgrund eines Hardwareausfalls im alten TSM Backup System kommt es zur zeit zu abbrechenden Backups und fehlschlagenden Restores.
TSM: Die Library ist wieder teilweise Einsatzfähig: ein Bandroboter (von zwei) und alle Bandlaufwerke arbeiten wieder.
Um kleine Updates im neuen Commvault Backup System vorzunehmen, müssen im genannten Zeitraum einzelne Systeme neu gestartet werden. Hierdurch kann das Webinterface (console1.dasi.rwth-aachen.de) kurzfristig nicht erreichbar sein.