Die aktuellen Zahlen einer Umfrage unter den Anwendern von Oracle-Datenbanken bestätigen einen seit Jahren anhaltenden Trend: Datenbanken wachsen und verursachen in den Unternehmen immer höhere Kosten.
Die CSP GmbH & Co. KG, Großköllnbach, hat im Verlauf der DOAG-Konferenz Ende 2009 70 Unternehmen mit produktiver Oracle-Datenbank befragt, wie sie die Tendenz bei den Storagekosten einschätzen. Fast jeder Zweite gab an, dass die Ausgaben für Speichermedien stetig steigen. Neben den Anschaffungspreisen werden hier auch Kosten für beispielsweise Strom berücksichtigt, der für die Kühlung und Betrieb benötigt wird. Im Vergleich zur Vorjahresbefragung blieb zwar die Zahl der Unternehmen mit einem Datenbankvolumen von über fünf Terabyte etwa konstant bei 34 %. Starke Zuwächse sind jedoch bei einem Datenbankvolumen von ein bis fünf Terabyte zu verzeichnen: Diese Zahl verdoppelte sich fast von 14 auf 26 %.

„Schon bei mittlerem Datenbank- aufkommen kann sich eine Datenbank- archivierung schnell amortisieren.” Stefan Brandl ist Produktmanager Datenbank- archivierung bei CSP (Bild: CSP)
Schon seit langem empfehlen Analysten wie Forrester Research, die Datenbankarchivierung als Standard-Bestandteil von Information-Lifecycle-Management-Strategien (ILM) zu sehen. Neben dem Wachstum der Datenbanken ist ein wesentlicher Grund, dass ohnehin rund 85 % aller Daten in Datenbanken inaktiv sind. Auf diese Daten muss lediglich in Ausnahmefällen zugegriffen werden. Sie werden vor allem aufgrund gesetzlicher und unternehmensinterner Bestimmungen aufbewahrt.
Hardware-Kostenspirale dreht sich beständig nach oben
Laut CSP beträgt die Größe einer Datenbank in den meisten Unternehmen mindestens den Faktor drei der eigentlichen Nutzgröße. Dies ist bedingt durch übliche Sicherungsmechanismen, die für Datenbanken angelegt werden. Ein schneller Online-Zugriff auf die Daten wird durch die Nutzung von Indizes sichergestellt. Durch dieses Vorgehen sinkt die Performance der Datenbank kontinuierlich. Die Folge ist eine Verärgerung der Anwender, die in ihrer Arbeit durch lange Wartezeiten eingeschränkt sind, wenn sie Datenbankabfragen durchführen.
Diese Faktoren sorgen dafür, dass in den meisten Unternehmen eine Kostenspirale in Gang gesetzt wird, die sich beständig nach oben dreht: Die IT-Entscheider schaffen regelmäßig immer noch leistungsfähigere Hardware an, sodass die Antwortzeiten der Datenbank kurzzeitig optimiert werden. Parallel dazu steigt das Datenvolumen aber immer weiter an - bis wieder neue Hardware gekauft wird. Umfangreiche Datenbanken im Online-Zugriff zu haben, bedeutet demnach eine hohe Investition in Datenspeicher und im nächsten Schritt auch in qualifiziertes Personal, welches diese IT-Strukturen professionell administrieren kann.
Das Thema Information-Lifecycle-Management rückt daher nun in den Fokus. Eine auf das jeweilige Unternehmen angepasste ILM-Strategie muss entwickelt werden. Die Datenbankarchivierung bildet dabei das Herzstück dieser Strategie, denn nicht oder selten benötigte Daten lassen sich völlig problemlos auf preiswerte, revisionssichere Speichermedien für die Langzeitarchivierung auslagern.
Dialog mit der Fachabteilung aufnehmen
Ein wichtiger Knackpunkt beim Implementieren einer Datenbankarchivierung ist es, den Lebenszyklus von Daten zu analysieren. Dies kann in der Regel nicht allein durch die Technik und das Engagement der IT-Abteilung gelöst werden, sondern erfordert eine intensive Zusammenarbeit mit den Anwendern der Fachabteilung. Einen möglichst exakten Überblick über die Datenbank-Landschaft sowie über die häufig benötigten Daten zu gewinnen, ist das Ziel.
In Datenbanken stecken die vielfältigsten Informationen, die wegen ihrer rechtlichen Relevanz langfristig aufbewahrt werden müssen. Neben den steuerlich bedeutsamen Daten, die hier abgelegt werden, sind auch beispielsweise Qualitätssicherungsdaten, Prozess-, Produktions- und Verwaltungsdaten von Drittsystemen in Datenbanken gespeichert, so etwa die Indexdaten aus einem Content-Management-System. Diese Massendaten sind ein wesentlicher Grund dafür, dass die Produktivsysteme derart explosionsartig wachsen. Darüber hinaus tragen die zahlreichen Regelungen und Vorschriften zur Aufbewahrung elektronisch verfügbarer Daten zum enormen Wachstum der Datenbanken bei.
Nationale Normen wie GDPdU, GoBS, Basel II, aber auch andere Vorgaben haben in ihrer Bedeutung stark zugenommen und wirken sich somit auf die Pflicht zur Archivierung aus. Die Aufbewahrungsdauer kann von einigen Jahren bis hin zu mehreren Jahrzehnten vorgegeben sein, beispielsweise wenn es im Healthcare-Umfeld um Patientendaten geht. Ein weiteres Beispiel für branchenspezifische Regularien stellt das Federal Register CFR Part 11 dar, ein weltweit anerkanntes Regelwerk für standardisierte Herstellungsmethoden im Pharma- und Lebensmittelbereich. Ein gut konzipiertes Archiv hilft den Unternehmen bei der Erfüllung dieser Vorgaben.
Inkrementelle Archivierung
Wie funktioniert eine Datenbankarchivierung? Mit einer Lösung wie beispielsweise Chronos von CSP wird inkrementell archiviert, das heißt, es werden nur die Daten gesichert, die seit dem letzten Archivierungsvorgang neu hinzugekommen sind und neu unter das Archivierungskriterium fallen. Diese lassen sich zu jedem Zeitpunkt wieder in die Datenbank zurück importieren.
Eine wichtige Eigenschaft der Datenbankarchivierung ist die Beachtung relationaler Abhängigkeiten und die Unterstützung veränderter Strukturen. Diese gewährleistet, dass Daten im Archiv konsistent zum verwendeten Datenbankschema sind. Gerade weil Datenbanken über einen längeren Zeitraum verwendet werden, sind Änderungen, beispielsweise in der Struktur selbst oder auch in Bezug auf die Semantik, fast unvermeidlich. In den meisten Unternehmen ändert sich die Datenbankstruktur über einen Zeitraum von mehreren Jahren sogar recht häufig.
Zu den strukturellen Änderungen gehören beispielsweise umbenannte Tabellen oder neu hinzugefügte Spalten. Auch kann es immer wieder sein, dass vorhandene Spalten gelöscht werden. Bei den semantischen Änderungen kommen Namensänderungen von Städten, Abteilungen oder Werken vor. Solche speziellen Veränderungen erfordern eine manuelle Unterstützung durch einen Administrator. Jedoch können bei der Archivierung von Datenbanken syntaktische und semantische Änderungen identifiziert und im Archiv protokolliert werden. Chronos-Archivdaten lassen sich zum Beispiel beim Restore in ein vom Anwender gewünschtes Datenbankschema laden.
Hohe Einsparungen im Storagebereich
Eine Datenbank mittlerer Größe, beispielsweise mit einem Datenvolumen von 200 GB und einem realistischen Zuwachs von 50 % in den kommenden Jahren, benötigt in fünf Jahren bereits einen Speicherplatz von 1,5 TB. Durch eine inkrementelle Datenbankarchivierung lässt sich das Datenvolumen in der Datenbank auf 800 GB beschränken. Erfahrungswerte zeigen, dass sich der Einsatz einer Datenbankarchivierung sogar schon bei mittlerem Datenbankaufkommen, wie etwa in Teilbereichen eines Unternehmens, schon sehr schnell amortisieren kann.
In wieweit sich die Installation einer Datenbankarchivierung tatsächlich kurz- bis mittelfristig rechnet, lässt sich für jedes Unternehmen individuell berechnen. Die wesentlichen Parameter werden hierfür zusammengetragen, wie zum Beispiel das Volumen der Datenbank, der jährliche Zuwachs und die durchschnittlichen Kosten pro Gigabyte. Auf dieser Basis ergeben sich dann präzise Werte zur Volumen- und Kostenentwicklung.





1/2012
8/2011
7/2011


Mag. Christoph Weiss, i2s consulting, Leiter Büro Österreich: Magister und Textil-Fachingenieur. Führungserfahrung als IT-Leiter im Bereich technischer Grosshandel. Mehrfach Linien- verantwortlicher für ERP-Einführungen. Lehrbeauftragter an der Fachhochschule Technikum Wien. Vorstandsmitglied der Arbeitsgemeinschaft für Datenverarbeitung (ADV) 