3/96

Mit Datenbanken ins World Wide Web

Objekt-relationale Datenbanksysteme und Entwicklungswerkzeuge im World Wide Web - Bedeutung, Datenbankeinbindung, Anforderung und Trends

Harald Gaudera

Mit mehr als 30 Millionen Benutzern - deren Zahl um monatlich 15 Prozent zunimmt - hat sich das Internet zu einer der wichtigsten Kommunikationsplattformen von heute entwickelt. Durch die globale Verbindung zahlreicher öffentlicher und privater Netze ermöglicht es eine medium- und plattformunabhängige Kommunikation sowie sekundenaktuelle Informationen aus allen Ländern der Welt.

Der Internet-Boom fand erst in den letzten Jahren statt und wurde durch den immer stärker werdenden Einsatz von graphisch orientierten, leicht bedienbaren World Wide Web Browsern, wie beispielsweise Netscape oder Mosaic, und der enormen Verbreitung des Personal Computers getragen.

Das neu geschaffene Massenmedium World Wide Web stellt für die Softwareindustrie eine neue Herausforderung - einen Emerging Market - dar, in welchem Wachstum und Expansion lediglich durch die Geschwindigkeit der Entwicklung und Vermarktung neuer Technologien limitiert ist.

Nicht nur die enorme Vielfalt aktueller Informationen, sondern auch die vergleichsweise geringen Kosten tragen zum Erfolg des World Wide Webs bei. Ganz unterschiedlich zur traditionellen Telekommunikation sind die Übertragungskosten unabhängig von Entfernung und Zeit. Für Datenzugriffe via Modem und Telefonleitung fallen, abgesehen von den geringen Errichtungskosten, in der Regel nur die lokalen Telefongebühren sowie ein geringer, monatlicher Pauschalbetrag an den Internet-Service-Provider an. Daraus resultieren - speziell im grenzüberschreitenden Informationsaustausch - signifikante Einsparungen.

Die graphischen Oberflächen und Multimediafähigkeiten moderner World Wide Web Browser erlauben es, Informationen in Form von bewegten und unbewegten Bildern zu visualisieren und durch Tonwiedergabe akustisch zu untermalen.

Damit ist die Präsentation und die Wirksamkeit von Informationen dem menschlichen Denken näher - welches sich vorwiegend in Form von Vorstellungen und Bildern vollzieht. Beispielsweise kann durch bebilderte Kataloge, bewegte, animierte Produktpräsentationen, Musik- und Videosamples eine ansprechendere und direktere Kommunikation und Information erzielt werden.

Die Informationen werden umfassender und intuitiver, die Akzeptanz von Produkten nimmt in Korrelation mit dem Unternehmenserfolg zu. Das kostenintensive Aktualisieren, Drucken, Publizieren und Versenden von Informationen entfällt, an deren Stelle tritt die mit minimalen Aufwand verbundene Veröffentlichung im World Wide Web. Weltweit, jederzeit erreichbar und aktuell.

Bestellungen, Umfragen, Seminaranmeldungen, Fernunterricht, betriebliche Datenerfassungen können ortsungebunden, ohne Zeitverlust und ohne Verwaltungsaufwand mittels interaktiver Web-Formulare effizient erledigt werden. Alle Möglichkeiten stehen nicht nur weltweit im Internet zur Verfügung, sondern können auch ausschließlich in innerbetrieblichen Netzwerken - sogenannten Intranets - genutzt werden.

Die Einbindung von Datenbanken in das World Wide Web

Ressourcen - Informationen - werden in Form von Web-Pages zur Verfügung gestellt. Web-Server und einzelne Web-Pages auf diesen Servern können mittels Uniform Ressource Locators (URL's), z.B. 'http://www.cai.com/', angesprochen werden. Jede Page kann Verweise auf weitere Pages - sogenannte HyperText Links - enthalten. Zum Navigieren zwischen diesen Pages dient das HyperText Transfer Protocol (HTTP).

Die Pages selbst sind in der standardisierten HyperText Markup Language (HTML) implementiert. Der derzeit geltende Standard ist HTML-2 beziehungsweise ISO 8779. Das World Wide Web kann man sich als riesige Bibliothek vorstellen, in der Millionen von Buchseiten schwerelos umherschweben, verbunden mit Abermillionen spinnwebdünner Verbindungsfäden, den HyperText Links. Entlang dieser Fäden kann man zu immer neuen Seiten mit weiteren Informationen gelangen.

HTML-Dokumente sind ASCII-Files, welche freie Texte und HTML-Tags, welche die Steuersprache darstellen, enthalten. HTML-Tags dienen unter anderem der Textformatierung und dem Verweis auf weitere Web-Pages oder Bilder. Mittels herstellerspezifischen Pseudo-Tags können auch Benutzerinteraktionen, wie Eingaben, Mausklicks, Datenbankzugriffe, einfache Verarbeitungen und Verweise auf externe Programme - sogenannte Applets - eingebettet werden.

Populäre Sprachen hierfür sind JavaScript und Java von SUN Microsystems. Diese Programme werden automatisch ausgeführt, wenn auf das entsprechende HTML-Dokument zugegriffen wird und können je nach Benutzerinteraktion dynamisch Informationen aus relationalen und objektorientierten Datenbanken - bereitstellen.

Neue Anforderungen

Um Informationen zentral zu warten, sie gleichzeitig vielen Benutzern zur Verfügung zu stellen und vor unberechtigten Zugriffen zu schützen bieten sich Datenbanksysteme als Datenbasen im Internet an. Es ergeben sich jedoch neue, zum Teil mit herkömmlichen Technologien konfliktierende Anforderungen an Datenbanksysteme und Softwareentwicklungswerkzeuge im World Wide Web.

Zum einen sind hier Multimedia- und Objektdaten, typischerweise Bild-, Video- und Audiodaten, Landkarten, Zeitserien, räumliche Daten, etc. stark verbreitet und zum anderen ist ein unternehmensweiter Datenzugriff - Enterprise Access oder auch Datawarehouse - erforderlich, um bestehende Daten, Soft- und Hardware einzubeziehen und so getätigte Investitionen zu sichern.

Die nahtlose Integration mit bestehenden, numerischen und alphanumerischen Unternehmensdaten in relationalen Datenbanksystemen (etwa CA-OpenIngres, CA-Datacom, CA-IDMS, DB2, Informix, Oracle, Sybase, SQL-Server) oder auch in Filesystemen am Großrechner (IMS, VSAM) ermöglicht es, vorhandene Applikationen unverändert weiterzubetreiben und für Neuentwicklungen objektorientierte Datenbanktechnologien einzusetzen.

Multimedia- und Objektdaten sind am besten durch objektorientierte Datenbanksysteme verwaltbar, da diese in der Lage sind, die inherente Struktur der Daten zu analysieren und zu verarbeiten. So kann beispielsweise nach bestimmten Gesichtern auf Bildern gesucht werden, nach bestimmten Koordinaten in räumlichen Daten und weiterem mehr.

Relationale Datenbanksysteme hingegen behandeln Objekt-Daten in der Regel als Binary Large Objects (BLOB's). BLOB's sind nicht strukturiert, nicht suchbar, nicht indizierbar, können nicht verglichen werden und rangieren als zweitklassiger Datentyp in der relationalen Welt. Neben BLOB's bieten manche Hersteller relationaler Datenbanken auch eine Objekterweiterbarkeit - ein sogenanntes Object Management - an. Es gestattet die Implementierung von neuen SQL- Datentypen und von SQL-Methoden, welche auch die innere Struktur ihrer Datenobjekte verstehen und Vergleiche zulassen.

Vollkommen objektorientierte Datenhaltung bietet hingegen zusätzliche Vorteile, wie beispielsweise eine rein objektorientierte Datensicht, die Vererbbarkeit von Attributen und Methoden, etc. Objektorientierte Datenbanken arbeiten nach dem Prinzip des navigierenden Datenzugriffs entlang von Verkettungen, was die Performance und die Flexibilität von Datenzugriffen limitieren kann.

Relationale Datenbanken sind zumeist skalierbar und geeignet, auch große Transaktionslasten zu bewältigen und unerwartete Belastungsspitzen dynamisch abzufangen. Die Hauptanforderung an Client/Server Systeme im World Wide Web ist jedoch, das Internet nicht als revolutionäres, riesiges Betriebs- und Datenhaltungssystem überzubewerten, sondern evolutionäre Technologien, unter Abwägung von Chancen und Risken realistisch in das bestehende EDV-Umfeld zu integrieren.

Soviele Vorteile das Internet zu bieten scheint, soviele Schwächen sind derzeit auch noch vorhanden: Transferraten, Robustheit, Datensicherheit und auch Systemverwaltbarkeit sind oft nicht ausreichend. Nur Hochleistungsverbindungen, wie TV-Kabel, ISDN und andere bieten die für industrielle Anwendungen ausreichenden Transferraten und ermöglichen es, mehrere Anwendungen gleichzeitig zu betreiben. Genauso ist die Robustheit, Transaktionssicherheit und Performance von Anwendungen und Datenbanksystemen wesentlich für den kommerziellen Einsatz.

Eine ganz entscheidende Anforderung an Datenbanksysteme und Anwendungsentwicklungswerkzeuge im Internet ist die Erfüllung von Datensicherheit und effiziente Verwaltbarkeit. Hierzu gehören Funktionen wie einmalige Benutzer-Identifikation im Netzwerk (Single-Sign-On), Securityfunktionen, Protokollierung von Aktivitäten, Accounting, Backup und Recovery, dynamische Speicherverwaltung, Problemverfolgung, Überwachung von Internet Ereignissen sowie aller beteiligten Prozesse und automatisiertes Ausnahmemanagement mit definierten Gegenmaßnahmen.

Trends und Entwicklungen

Um die neuen Anforderungen durch das World Wide Web bestmöglich zu erfüllen und die Vorteile relationaler und objektorientierter Technologien zu kombinieren, stellen Datenbankhersteller wie Computer Associates, Informix, Oracle und andere objekt-relationale Datenbanksysteme und Entwicklungswerkzeuge zur Verfügung.

Meistens handelt es sich dabei um die Integration einer existierenden objektorientierten Technologie in das relationale System. So entstanden im Zuge einer Kooperation zwischen Computer Associates und Fujitsu das objektorientierte System CA-OpenIngres/Jasmine und das OO-Entwicklungswerkzeug Jade, welches auf Jasmine als Klassenrepository aufsetzt. Existierende relationale Datenbanken sind durch eine objektorientierte Sichtweise direkt in Jasmine Datenbanken integrierbar.

Mittels CA-Unicenter ist automatisierte, aktive Datenbank-, Netzwerk- und Systemüberwachung möglich. Ähnlich war es bei Informix. Gemeinsam mit Illustra, dessen Wurzeln kurioserweise mit denen von Ingres an der University of Bercley in Kalifornien zusammenlaufen, werden ein objektorientiertes Datenbanksystem sowie eine Reihe von Klassenbibiliotheken (Data Blades) zur Verfügung gestellt. Der geplante Informix Universal Server wird Informix' und Illustra's Produkte stärker integrieren und soll um parallele Verarbeitungsfähigkeiten erweitert werden.

Oracle's Vision des Network Computing inkludiert das relational-objektorientierte Produkt Oracle Universal Database sowie den Network Computer - einen kostengünstigen Internet Arbeitsplatz, für den sämtliche Software aus dem World Wide Web geladen wird.

Im allgemeinen bieten die verschiedenen Hersteller Multiplattformunterstützung, vorwiegend für Unix, Windows/NT und Windows95 sowie die Unterstützung von World Wide Web Browsern, allen voran Netscape (NSAPI), sowie von weiteren Schnittstellen, beispielsweise Java, JavaScript, CGI-Script, Visual Basic, OCX, C++, Smalltalk an. Daten aus diversen relationalen Datenbanksystemen (beispielsweise CA-OpenIngres, CA-IDMS, CA-Datacom, DB2, Informix, Oracle, SQL- Server, Sybase) sind mehr oder weniger integrierbar.