Wir möchten mit einer Reihe von Artikeln Einblicke in unsere Arbeit mit Großprojekten geben. Dabei stellen wir Verfahren zur Analyse und Lastverteilung vor.
Ein Bestandteil unser Arbeit ist die Kontrolle und Systemanalyse. Verschiedenste Dienste und Leistungen eines Clusters werden überwacht und beurteilt. Dabei gehen wir weiter als nur die Systemauslastung auszuwerten. Es spielen verschiedene Faktoren wie z.B. Verteilung der Anfragen, Festplattenaktivität, Netzwerkverkehr u.v.m für einen aussagekräftigen Performancereport eine Rolle. Mit diesen Performancereports erkennen wir frühzeitig Engpässe und erarbeiten Lösungen für einen optimalen Betrieb, bevor es zu Beeinträchtigungen kommt. So steht unseren Kunden jeder Zeit die Leistung zur Verfügung die von der Anwendung benötigt wird, um einwandfrei die nötigen Aufgaben abarbeiten zu können. Störungen vermeiden und die Systeme auf neue Gegebenheiten wie steigende Besucheraktivität zu optimieren sind primäre aufgaben unseres Operationsteams.
Loadbalancing eines Web-Clusters
Die Analyse aktiver Verbindungen deckt oft als erstes einen Flaschenhals auf. So kann eine plötzlich steigende Zahl der aktiven Verbindungen ein Rückschluss auf schleppende Verarbeitung der HTTP-Anfragen sein. Die Ursachen hierfür können je nach Applikation variieren und müssen daher unterschiedlich bewertet werden. Natürlich muss es nicht zwingend eine Störung sein, die ein solches Verhalten hervorruft. Auch könnte eine Medienpräsenz wie z.B. Fernsehreportage oder andere natürliche Ursache für das Ansteigen der aktiven Verbindungen ein Grund sein. Ganz gleich welche Ursache es hat – Für uns ist es ein Grund der dem nachzugehen, um so präventiv einer Störung vorzubeugen und den Cluster für die höheren Anforderungen, aufgrund gestiegener Besucheraktivität, zu erweitern.

Verbindungsverteilung eines Web-Clusters der letzten 6 Stunden - Verbindungen / Sekunde

Verbindungsverteilung eines Web-Clusters der letzten 24 Stunden - Verbindungen / Sekunde