3/97

Aktenschränke haben keinen Internet-Anschluß

Ingo Wenzel

Das Internet ist ein riesiges Informationslager, und das World Wide Web hat es sehr viel einfacher gemacht, damit umzugehen. Diese Technik ist auch für elektronische Archive attraktiv, die damit für den Betrieb im Inter- oder Intranet geeignet werden und so den weltweiten Zugriff auf den kompletten Datenbestand des Unternehmens ermöglichen.

Elektronische Archive brauchen wesentlich weniger Platz als herkömmliche Aktenschränke, und die Suche nach Dokumenten darin ist sehr viel komfortabler. Aktenschränke lassen sich außerdem nicht über das Internet durchsuchen, dagegen ist die Internet- Recherche in einem elektronischen Archiv im wesentlichen eine Frage der Protokolle und Dateiformate.

Als Speicherformat für Dokumente ist in elektronischen Archiven das Faxformat der Gruppe 4 recht verbreitet, außerdem das TIFF-Format. Im World Wide Web ist zwar HTML Standard, doch das zugrundeliegende Protokoll HTTP ermöglicht auch die Einbindung von Daten anderer Formate. Um diese darzustellen braucht der Anwender allerdings die entsprechende Applikation, daher liegt es nahe, das Inter- oder Intranet nicht nur als Transportmittel und Lagerort für die Dokumente zu benutzen, sondern auch die Ablage- und Recherche-Software über das Netz zu verbreiten.

Sofern Dokumente ins HTML-Format konvertiert werden oder entsprechende Zusätze mitgeliefert werden, lassen sie sich mit jedem Browser betrachten. Soll jedoch die Bedienung der üblichen Abfrage-Software des elektronischen Archivs erhalten bleiben, reicht dieses Verfahren nicht mehr aus. Daher hat das Systemhaus daa sich zu einem zweigleisigen Vorgehen bei seinem Dokumentenmanagement- und Archivierungssystem ScanView plus entschlossen: Einfache Abfragen sind mit jedem Browser möglich; für Recherchen mit dem gewohnten Leistungsumfang wurde der ScanView plus-Client in Java nachgebildet, denn der übliche Client ist viel zu umfangreich für die Verbreitung über das Internet.

Er wurde mit einem 4GL-Tool entwickelt und leistet die Hauptarbeit, während der Server im wesentlichen Ablageort ist. Dem Client können daher keine weiteren Aufgaben wie TCP/IP- und HTML-Fähigkeiten aufgebürdet werden, zumal auch Sicherheit und Performance dabei unzureichend wären.

Immerhin ist ScanView plus in Client-Server-Technik aufgebaut und bietet daher gute Voraussetzungen für den Betrieb im Internet oder Intranet. Die Archiv-Software speichert die eingescannten oder importierten Dokumente in einer SQL-Datenbank. Die Suchbegriffe, mit denen die Dokumente später wiedergefunden werden können, legt es in einer zusätzlichen Index-Datenbank ab. Die Zugriffsberechtigung kann bis auf Dokumentenebene geregelt werden. Wenngleich die Dokumente in komprimierter Form gespeichert werden, sind Anwender, die Gigabyte in ihren Archiven lagern, keine Seltenheit.

Die Recherche-Clients als Java-Applets zu programmieren und Browser als Dokumenten-Viewer einzusetzen hat viele Vorteile:

  • Der Java-Recherche-Client bietet eine plattformunabhängige, netzwerkübergreifende und über das Internet weltweite Recherche- möglichkeit.
  • Zur Dokumentenrecherche ist nur ein Netzwerkcomputer und ein Java-fähiger Browser mit passenden Viewern nötig.
  • Die Verbreitung der Recherche-Clients, etwa über das Internet, kostet nicht viel.
  • Bei einem Update des Recherche-Clients braucht dieser nur auf dem WWW-Server aktualisiert zu werden. Alle Benutzer haben bei Ihrer nächsten Sitzung dann sofort die neue Version zur Verfügung.
  • Das interne Netzwerk kann durch einen Firewall geschützt werden, da ein Recherche-Applet immer nur auf die Java-Server-Applikation auf dem WWW-Server zugreift.
  • Die Kommunikation zwischen Java-Server-Applikation und Internet-Server findet im internen, geschützten Netzwerk statt. Wenn jemand versucht, im Code des Recherche-Clients Informationen auszuspähen, könnte dieser lediglich Aufschluß über die Benutzerschnittstelle und das Übertragungsprotokoll erlangen, aber keine vertraulichen Informationen erhalten.

Java-Applets unterliegen allerdings einer Reihe von Sicherheitsbeschränkungen. Sie dürfen insbesondere nicht auf lokale Dateien zugreifen und nur Netzwerkverbindungen zu dem Rechner herstellen, von dem sie geladen wurden. Java-Applikationen dagegen unterliegen diesen Sicherheitsbestimmungen nicht; sie können beliebige Netzverbindungen eröffnen und haben auch Zugriff auf das lokale Dateisystem.

Es ist immerhin möglich, Anwendungen zu schreiben, die sowohl als Applet als auch als Applikation ausführbar sind. Wird die Anwendung mit einem WWW-Browser über das Netz geladen, unterliegt sie den Sicher- heitsrestriktionen von Applets; wird sie lokal gestartet, läuft die Anwendung als eigenständige Applikation und ist keinen Restriktionen unterworfen.

Um den Client von Aufgaben zu entlasten, wurden Aufgaben auf einen eigens dafür entwickelten Internet-Server übertragen. Client und Server verständigen sich mit Hilfe eines eigens dafür geschaffenen Übertragungsprotokolls. Es ist zeichenorientiert aufgebaut und somit auch plattformübergreifend einsetzbar. Wegen der angesprochenen Sicherheitsbeschränkung bei Java-Applets ist eine weitere Schicht erforderlich, denn Internet-Server und HTTP-Server laufen üblicherweise nicht auf demselben Rechner. Diese Schicht kann zugleich als Firewall zwischen Internet und dem internen Netzwerk dienen.

Die Java-Server-Applikation

Die Java-Applets und -Applikationen richten als Clients Anfragen an die Java-Server-Applikation, die dann die weitere Verbindung zum Internet-Server des Archivsystems herstellt. Die Java-Server-Applikation, deren Hauptaufgabe darin besteht, den Datenaustausch zwischen dem Recherche-Client und dem Archiv-Server zu regeln, muß lediglich auf dem gleichen Host laufen wie der HTTP-Server. Die Daten, die vom Client ankommen, werden zwischengepuffert und an den Internet-Server weitergereicht und umgekehrt. Dadurch lassen sich die Geschwindigkeitsunterschiede zwischen Internet und dem internen Firmennetz ausgleichen.

Der Schutz vor Mißbrauch beim Übertragen der Informationen über das Internet ist Aufgabe von Verschlüsselungsverfahren wie Secured Sockets Layer SSL 2.0, SSL 3.0 und PCT (Private Communications Technology). Da bei der Verschlüsselung in naher Zukunft noch einiges auf der Netzwerkebene zu erwarten ist, wird auf eine Verschlüsselung der Daten auf Applikationsebene verzichtet.

Recherche mit dem Java Recherche-Client

Das Recherche-Applet wird beim Aufruf der zugehörigen HTML-Seite mit einem Java-fähigen Browser gestartet und in einem eigenen Frame dargestellt. Nach dem Start des Applets wird der Benutzer nach Benutzername und Paßwort gefragt und über die Java-Server-Applikation am Internet-Server angemeldet. Der Benutzer wählt dann den Dokumententyp aus, nach dem er recherchieren will.

Anschließend werden ihm die zum Dokumententyp zugehörigen Qualifizierer angezeigt. Wenn der Benutzer nicht weiß, zu welchem Dokumententyp ein bestimmtes Dokument gehört oder wenn er eine generelle Recherche über alle Dokumententypen hinweg ausführen möchte, so kann er anhand der Auswahl der Qualifizierer auch seine individuelle Eingabe- und Suchmaske zusammenstellen.

Gefundene Dokumente werden in einer Liste angezeigt. Per Doppelklick öffnen sich die Dokumentensätze und der Benutzer erreicht die einzelnen Dokumente. Möchte sich der Benutzer nun Dokumente ansehen, holt die Java-Server-Applikation sie aus dem Archiv und legt sie als temporäre Dateien in ein dem WWW-Server zugängliches Verzeichnis. Das Recherche-Applet bekommt nun von der Java-Server-Applikation lediglich die Dateinamen der angelegten temporären Dateien übermittelt, erzeugt daraus eine neue URL und öffnet diese Datei dann als neues Fenster im WWW-Browser. Falls für einen Dateityp kein Viewer oder die zugehörige Applikation verfügbar ist, bieten die verschiedenen WWW-Browser an, die Datei auch lokal zu speichern, um diese anderweitig weiterzuverarbeiten.