Fachbücher

 
  Programm
Appetithappen
Bestellung

 

doculine Archiv

  Übersicht
Index
Autoren
Streifzüge

 
 

Service

 
  transline tecNews
Suche
Impressum
 

Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews

Erfolgreiches Informationsmanagement mit XML

 

Artikel erschienen in
Ausgabe September 2001

Von Jochen Schwarze

Inhaltsübersicht:

XML kann viel zu einem erfolgreichen Informationsmanagement beitragen. Doch XML ist eine Basistechnologie und kein Allheilmittel.


Was ist XML?

XML ist ein universeller Standard für die Beschreibung strukturierter Information und somit Grundlage für ein nachhaltiges Informationsmanagement. XML findet Anwendung bei den zentralen Aspekten des Informationsmanagements:

  • Erfassung und Archivierung von Dokumenten (Texte, Grafiken, …)
  • Austausch und Transport von Daten
  • Publikation und Benutzerinteraktion mit Information

Der Einsatz von XML erleichtert die Implementierung und Integration von Softwaresystemen erheblich. Synergie-Effekte haben XML zu einer beispiellosen Verbreitung und Akzeptanz verholfen.

XML ist vom Prinzip her ein Dateiformat; als Oberbegriff subsumiert es eine Methodik sowie zahlreiche Technologiekomponenten. XML ist aber keine Software und ersetzt insbesondere nicht eine Datenbank oder ein Dokumentenmanagement-System. Vielmehr bieten DM-Systeme zunehmend XML-basierte Schnittstellen zum Datenbestand an.


XML und Informationsmanagement

In der Praxis werden mit XML unterschiedliche Arten von Information beschrieben:

  • Inhalte:
    Hierzu gehören im weitesten Sinne visualisierbare Dokumente, z.B. Texte (technische Dokumentation, Fachartikel, Dokumente der Unternehmenskommunikation), Grafiken (SVG) oder wissenschaftliche Formeln (Chemie, Mathematik). Aus Sicht des Informationsmanagements besitzen XML-kodierte Informationseinheiten prinzipiell eine höhere (formale) Qualität; sie können vielfältig genutzt werden und stellen einen längerfristigen Wert dar als traditionell kodierte Inhalte (z.B. Office-Dokumente).
  • Metadaten:
    Dies sind Daten, die Informationseinheiten katalogisieren und Zusammenhänge zwischen diesen Einheiten beschreiben. Hierzu eignen sich die XML-Standards RDF und Topic Maps. Aus Sicht des Informationsmanagements sorgen diese Techniken für die Auffindbarkeit und Vernetzung von Informationseinheiten; der XML-Ansatz ist hier flexibler als traditionelle Verschlagwortung oder relationale Datenbankmodellierung.
  • Protokolle:
    XML-basierte Schnittstellen schaffen Brücken zwischen Systemen, die ursprünglich nicht für eine direkte Integration vorbereitet sind (Import/Export/Messaging/Integration/Reconciliation). Typisch ist eine relativ lose Kopplung über flexible Schnittstellen und etablierte Netzwerkprotokolle. Die Kombination von HTTP und XML wird zunehmend eingesetzt für die Middleware-Integration. Aus Sicht des Informationsmanagements ermöglichen diese Verfahren eine technische Erschließung verteilter und heterogener Informationsbestände.

XML ist also die technische Grundlage für qualitativ hochwertige, vernetzte und verfügbare Informationseinheiten – Katalysator für ein erfolgreiches Informationsmanagement.


Stichwort: strukturierte Information

Inhalte formal strukturieren, das bedeutet Gliederung und Logik eines Dokuments so zu erfassen, dass diese nicht nur für den menschlichen Leser, sondern auch für einen Computer sinnvoll greifbar sind. Das Dokument wird so zu einer Art Datenbank, die ausgewertet und gezielt nach bestimmten Inhalten durchsucht werden kann.

Beispielsweise ein typisches Besprechungsprotokoll als Word-Dokument: Die Liste der Teilnehmer, die gefassten Beschlüsse, Kürzel von Projekten und Organisationseinheiten etc. sind im Fließtext oder in Tabellen vergraben und können bestenfalls mittels Volltextsuche wiedergefunden werden – erfahrungsgemäß wenig treffsicher. In strukturierten Dokumenten hingegen sind solche Passagen identifizierbar: Man könnte sich die Beschlüsse des vergangenen Monats aus der eigenen Abteilung gezielt zusammenstellen lassen oder die Teilnehmer einer bestimmten Besprechung über eine abgeschlossene Aktion informieren.

Je strukturierter der Inhalt, desto länger und nachhaltiger ist übrigens auch die Informations-Wertschöpfungskette. Eine technische Zeichnung beispielsweise könnte ohne Bruch den gesamten Prozess durchlaufen von Konstruktion über Entwicklung und technische Dokumentation bis hin zur didaktisch aufbereiteten Schulungsunterlage und der interaktiven Explosionszeichnung für den Ersatzteilkatalog. Hier stellt SVG eine Basistechnologie dar, die eine solche Wertschöpfungskette zwar längst nicht trivial macht, aber sie doch von der Schublade "Utopie" in die Schublade "technisch machbar" befördert.


XML für Text und Grafik

Inhalte, die in einem traditionellen Anwendungsprogramm – ohne XML – erstellt werden, sind normalerweise fixiert auf eben dieses Anwendungsprogramm, auf genau eine Art der Publikation (z.B. DIN-A4-Papier) und auf genau eine Art von Konsument (nämlich den Leser). Bereits beim Austausch zwischen ähnlichen Anwendungsprogrammen (z.B. Office-Anwendungen oder Illustrationsprogramme verschiedener Hersteller) entstehen Reibungsverluste; auch Formate wie PDF befreien ein Dokument nicht von seiner Bindung an eine DIN-A4-Seite. Und eine typische, grafisch hoch aufbereitete HTML-Seite ist für die automatische Auswertung nahezu untauglich. Für Datenbanken und Content-Management-Systeme sind solche Inhalte Black Boxes, undurchsichtige Objekte, die bestenfalls im Volltext durchsuchbar sind.

XML hingegen kodiert Inhalte und macht Dokumente transparent:

  • transparent für die Verwaltung und automatisierte Verarbeitung in einer Datenbank
  • transparent für unterschiedliche Nutzungsformen (z.B. verschiedene Ausgabemedien)
  • transparent für unterschiedliche Nutzer (z.B. einen sehenden Menschen, einen blinden Menschen oder einen Computer)

White Box statt Black Box – strukturierte Inhalte sind für das Informationsmanagement besonders wertvoll.

XML-basierte Informationseinheiten, seien es Texte oder Grafiken, können im Informationsmanagement auch eine aktive Rolle spielen. Sie können automatisch am Workflow teilnehmen, weil ihre Inhalte Abläufe steuern können (z.B. Besprechungsprotokolle, Formularwesen des Qualitätsmanagements), oder sie können ihre Inhalte selektiv, kontextbezogen und zielgruppengerecht präsentieren.

Aus Sicht des Informationsmanagements kommt bei XML-Grafiken (SVG) noch ein weiterer Vorteil hinzu: Wegen der XML-bedingten Automatisierbarkeit wird es technisch und wirtschaftlich möglich, nicht nur textuelles Material, sondern auch grafisch aufbereitete Daten als qualitativ hochwertigen Informationsträger einzusetzen, z.B. Übersichtsdiagramme, didaktisch aufbereitete interaktive Darstellungen technischer Zusammenhänge, Präsentation von Zahlenmaterial, grafische Projektplanungs- und Projektverlaufsunterlagen.

Natürlich ist der flächendeckende Ersatz der etablierten Office-Anwendungen durch XML-basierte Systeme eine Utopie. Ein Knackpunkt ist daher die Erschließung von Inhalten aus Office-Dokumenten.


Die dot.doc Economy

Wir leben in einer dot.doc Economy: Wesentliche Anteile des Unternehmenswissens und -gedächtnisses sind in Office-Dokumenten verborgen. In einer schönen neuen Welt wären typische Unternehmensdokumente wie Sitzungsprotokolle, Präsentationen, Beschlussvorlagen, Projekttagebücher, Produktunterlagen etc. strukturiert in Datenbanken abgelegt, verschlagwortet, der Inhalt im Ganzen oder in Teilen bedarfsgerecht zugreifbar, selektierbar, rekombinierbar und medienneutral publizierbar.

Wirtschaftlich sinnvoll und leistbar ist dies bisher nur in Einzelfällen (z.B. im Bereich organisatorisch und inhaltlich anspruchsvoller technischer Dokumentation). In der typischen Unternehmenskommunikation kann man sich in den wenigsten Fällen dem Sog der Ad-hoc-Prozesse auf Basis populärer E-Mail- und Office-Programme entziehen. Ein Ersatz der vertrauten Office-Lösungen durch rein XML-basierte Software ist – aus heutiger Sicht – nahezu utopisch.

Einer der Faktoren für erfolgreiches Informationsmanagement ist es daher, Inhalte aus Office-Dokumenten (insbesondere Microsoft Word) für den nachfolgenden Workflow zu erschließen, ohne jedoch den Anwender direkt mit der XML-Thematik zu konfrontieren. Nicht in jedem Anwendungsfall ist dies optimal möglich, jedoch bieten geeignete Softwaresysteme auf XML-Basis auch hierfür Lösungen an.


Topic Maps – Themennetze

Topic Maps werden manchmal plakativ als das "GPS des Informationsuniversums" beschrieben. So wie eine Landkarte eine schematische Sicht auf eine reale Landschaft ermöglicht und bestimmte Merkmale der Landschaft (z.B. Städte, Straßen, Flüsse) markiert, kann eine Topic Map wichtige Merkmale eines Informationsbestands festhalten und in Bezug zueinander setzen. So wie ein GPS-Empfänger die eigene Position auf der Karte feststellt, kann eine Topic Map die Orientierung in einer virtuellen Welt vernetzter Dokumente herstellen.

Das klingt etwas exotisch, hat jedoch durchaus praktische und sehr weit gefächerte Anwendungen: Mit einer Topic Map lassen sich beispielsweise die klassischen Navigationselemente technischer Dokumentation (Inhalt, Index, Glossar etc.) in einheitlicher Weise beschreiben; eine andere Topic Map könnte die inhaltliche Vernetzung von Artikeln in einem Lexikon ausdrücken (z.B. Person A wurde geboren in Stadt B, B liegt in Land C, Oper D wurde komponiert von A, Person E war Zeitgenosse von A) und für "siehe auch"-Verweise sorgen (andere Werke dieses Komponisten, andere Städte in diesem Land etc.).

Topic Maps sind recht abstrakte Gebilde. Wo typische XML-Inhalte (z.B. eine XHTML-Seite oder eine SVG-Datei) noch eine definierte Optik besitzen und auf Papier druckbar sind, verrichten Topic Maps – ähnlich wie eine relationale Datenbank – ihren Dienst im Hintergrund. Sie werden typischerweise eingesetzt, um Navigation und Benutzbarkeit von webbasierten Informationssystemen zu erhöhen, z.B. in Enterprise Information Portals.

Topic Maps sind im Idealfall eine Art ruhender Gegenpol zum dynamischen Informationsbestand, weil die in ihnen beschriebenen Zusammenhänge im Gegensatz zu wechselnden Dokumenten langlebig sind und auch losgelöst von den verknüpften Dokumenten einen Informationsgehalt haben. Topic Maps kodieren Wissen. Man geht davon aus, dass es mit Topic Maps möglich sein wird, unterschiedlichste Informationsbestände logisch miteinander zu vernetzen.


Fazit

Die beste Strategie beim Umgang mit Unternehmensdokumenten ist, eine möglichst gute Basis für heute verfügbare Systeme des Informationsmanagements bereitzustellen und damit zugleich auf Lösungen des Wissensmanagements von morgen vorbereitet zu sein. XML als technische Basis ist ein wichtiger Schritt in diese Richtung.


Glossar

XML:
Extensible Markup Language. Web-Standard für die normierte Beschreibung beliebig strukturierter Inhalte. Im Kern ein universelles und internationales Dateiformat. Oberbegriff für eine Reihe flankierender (horizontaler) Standards, insbesondere zur automatischen Verarbeitung von XML-Daten (z.B. Adressierung, Transformation, Formatierung). Kristallisationspunkt für unzählige branchenspezifische (vertikale) Standards der Informationskodierung und des Informationsaustauschs (z.B. Ersatzteilkataloge, digitale Patientenakten, E-Commerce, Pressemeldungen, Finanzdienstleistungen, technische Dokumentation u.v.m.)

SVG:
Scalable Vector Graphics. Neues XML-basiertes Dateiformat für Vektor- und Rastergrafiken im Bereich Web und Print. Geeignet für ein breites Spektrum von Anwendungen (z.B. Illustrationen, Diagramme, Karten/geographische Informationssysteme, technische Zeichnungen, Webgrafik). Möglichkeit zur Beschreibung von Animation (z.B. Bewegung und Überblendeffekte) und Benutzer-Interaktion (z.B. Klicken und Ziehen). Erlaubt es, bestimmte Methoden des Content Managements und des Content Engineerings aus dem Textbereich (z.B. Volltextsuche, Übersetzungsmanagement, Hypertext) auch auf grafische Inhalte anzuwenden.

Topic Maps:
ISO-Standard 13250 für die Kodierung so genannter semantischer Netze, d.h. konzeptioneller Landkarten (Maps), mit denen sich ein thematischer Bezug zwischen interessanten Punkten (Topics) einer Informationslandschaft herstellen lässt. Ursprünglich für die Verschlagwortung im Verlagsbereich entwickelt, werden Topic Maps mittlerweile als universelles Medium für die Beschreibung von Relationen innerhalb beliebiger Informationsbestände benutzt. Topic Maps sind zugleich interessante Methodik und Basistechnologie für Wissensmanagement-Systeme.

XSLT:
Extensible Stylesheet Language Transformations. Programmiersprache für die Transformation zwischen verschiedenen XML-Datenmodellen. Bei der Integration von Softwaresystemen ist XSLT weit verbreitet als Universaladapter für die Übersetzung zwischen unterschiedlichen Dialekten der Sprache XML.

RDF:
Resource Description Framework. Universeller XML-basierter Standard für die Katalogisierung von Dokumenten. Ursprünglich von Netscape für die Beschreibung von Web Channels entworfen, findet es zunehmend Einsatz im Umfeld webbasierter Informationssysteme, bei Dokumenten- und Wissensmanagement.


Link zu Hintergrundinformationen

Weitere Informationsquellen und Internet-Links zum Thema XML finden Sie unter http://www.jochen-schwarze.de.

Leserbrief schreiben

  Doculine durchsuchen:   

  

Empfehlenswerte Seiten zur technischen Übersetzung
von transline - Übersetzungsdienst für technische Übersetzung
technische Übersetzungen | Übersetzung Software | Software Lokalisierung
Spez. Seiten zu Sprachen
Chinesisch Übersetzung | Englisch Übersetzung | Französisch Übersetzung | Niederländisch Übersetzung | Russisch Übersetzung | Spanisch Übersetzung | Portugiesisch Übersetzung | Italienisch Übersetzung | Japanisch Übersetzung
Infos zum Übersetzungsservice transline

Übersetzungen Ihrer Patente - Dr. Sturz Patentübersetzungen

Letzte Änderung: Monday, 31-Oct-2005 17:27:58 CET | Presse-Service | Disclaimer
© doculine Verlags-GmbH, ein Unternehmen der transline Gruppe