|
Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews
Erfolgreiches Informationsmanagement mit XML
Artikel erschienen
in
Ausgabe September
2001
Von Jochen
Schwarze
Inhaltsübersicht:
XML kann viel zu einem erfolgreichen Informationsmanagement
beitragen. Doch XML ist eine Basistechnologie und kein Allheilmittel.
Was ist XML?
XML ist ein universeller Standard für die Beschreibung strukturierter
Information und somit Grundlage für ein nachhaltiges Informationsmanagement.
XML findet Anwendung bei den zentralen Aspekten des Informationsmanagements:
- Erfassung und Archivierung von Dokumenten (Texte, Grafiken,
)
- Austausch und Transport von Daten
- Publikation und Benutzerinteraktion mit Information
Der Einsatz von XML erleichtert die Implementierung und Integration
von Softwaresystemen erheblich. Synergie-Effekte haben XML zu
einer beispiellosen Verbreitung und Akzeptanz verholfen.
XML ist vom Prinzip her ein Dateiformat; als Oberbegriff subsumiert
es eine Methodik sowie zahlreiche Technologiekomponenten. XML
ist aber keine Software und ersetzt insbesondere nicht eine Datenbank
oder ein Dokumentenmanagement-System. Vielmehr bieten DM-Systeme
zunehmend XML-basierte Schnittstellen zum Datenbestand an.

XML und Informationsmanagement
In der Praxis werden mit XML unterschiedliche Arten von Information
beschrieben:
- Inhalte:
Hierzu gehören im weitesten Sinne visualisierbare Dokumente,
z.B. Texte (technische Dokumentation, Fachartikel, Dokumente
der Unternehmenskommunikation), Grafiken (SVG) oder wissenschaftliche
Formeln (Chemie, Mathematik). Aus Sicht des Informationsmanagements
besitzen XML-kodierte Informationseinheiten prinzipiell eine
höhere (formale) Qualität; sie können vielfältig
genutzt werden und stellen einen längerfristigen Wert dar
als traditionell kodierte Inhalte (z.B. Office-Dokumente).
- Metadaten:
Dies sind Daten, die Informationseinheiten katalogisieren und
Zusammenhänge zwischen diesen Einheiten beschreiben. Hierzu
eignen sich die XML-Standards RDF und Topic Maps. Aus Sicht
des Informationsmanagements sorgen diese Techniken für
die Auffindbarkeit und Vernetzung von Informationseinheiten;
der XML-Ansatz ist hier flexibler als traditionelle Verschlagwortung
oder relationale Datenbankmodellierung.
- Protokolle:
XML-basierte Schnittstellen schaffen Brücken zwischen Systemen,
die ursprünglich nicht für eine direkte Integration
vorbereitet sind (Import/Export/Messaging/Integration/Reconciliation).
Typisch ist eine relativ lose Kopplung über flexible Schnittstellen
und etablierte Netzwerkprotokolle. Die Kombination von HTTP
und XML wird zunehmend eingesetzt für die Middleware-Integration.
Aus Sicht des Informationsmanagements ermöglichen diese
Verfahren eine technische Erschließung verteilter und
heterogener Informationsbestände.
XML ist also die technische Grundlage für qualitativ hochwertige,
vernetzte und verfügbare Informationseinheiten Katalysator
für ein erfolgreiches Informationsmanagement.

|
Stichwort: strukturierte Information
Inhalte formal strukturieren, das bedeutet Gliederung und
Logik eines Dokuments so zu erfassen, dass diese nicht nur
für den menschlichen Leser, sondern auch für einen
Computer sinnvoll greifbar sind. Das Dokument wird so zu
einer Art Datenbank, die ausgewertet und gezielt nach bestimmten
Inhalten durchsucht werden kann.
Beispielsweise ein typisches Besprechungsprotokoll als
Word-Dokument: Die Liste der Teilnehmer, die gefassten Beschlüsse,
Kürzel von Projekten und Organisationseinheiten etc.
sind im Fließtext oder in Tabellen vergraben und können
bestenfalls mittels Volltextsuche wiedergefunden werden
erfahrungsgemäß wenig treffsicher. In
strukturierten Dokumenten hingegen sind solche Passagen
identifizierbar: Man könnte sich die Beschlüsse
des vergangenen Monats aus der eigenen Abteilung gezielt
zusammenstellen lassen oder die Teilnehmer einer bestimmten
Besprechung über eine abgeschlossene Aktion informieren.
Je strukturierter der Inhalt, desto länger und nachhaltiger
ist übrigens auch die Informations-Wertschöpfungskette.
Eine technische Zeichnung beispielsweise könnte ohne
Bruch den gesamten Prozess durchlaufen von Konstruktion
über Entwicklung und technische Dokumentation bis hin
zur didaktisch aufbereiteten Schulungsunterlage und der
interaktiven Explosionszeichnung für den Ersatzteilkatalog.
Hier stellt SVG eine Basistechnologie dar, die eine solche
Wertschöpfungskette zwar längst nicht trivial
macht, aber sie doch von der Schublade "Utopie"
in die Schublade "technisch machbar" befördert.
|

XML für Text und Grafik
Inhalte, die in einem traditionellen Anwendungsprogramm
ohne XML erstellt werden, sind normalerweise fixiert auf
eben dieses Anwendungsprogramm, auf genau eine Art der Publikation
(z.B. DIN-A4-Papier) und auf genau eine Art von Konsument (nämlich
den Leser). Bereits beim Austausch zwischen ähnlichen Anwendungsprogrammen
(z.B. Office-Anwendungen oder Illustrationsprogramme verschiedener
Hersteller) entstehen Reibungsverluste; auch Formate wie PDF befreien
ein Dokument nicht von seiner Bindung an eine DIN-A4-Seite. Und
eine typische, grafisch hoch aufbereitete HTML-Seite ist für
die automatische Auswertung nahezu untauglich. Für Datenbanken
und Content-Management-Systeme sind solche Inhalte Black Boxes,
undurchsichtige Objekte, die bestenfalls im Volltext durchsuchbar
sind.
XML hingegen kodiert Inhalte und macht Dokumente transparent:
- transparent für die Verwaltung und automatisierte Verarbeitung
in einer Datenbank
- transparent für unterschiedliche Nutzungsformen (z.B.
verschiedene Ausgabemedien)
- transparent für unterschiedliche Nutzer (z.B. einen
sehenden Menschen, einen blinden Menschen oder einen Computer)
White Box statt Black Box strukturierte Inhalte sind für
das Informationsmanagement besonders wertvoll.
XML-basierte Informationseinheiten, seien es Texte oder Grafiken,
können im Informationsmanagement auch eine aktive Rolle spielen.
Sie können automatisch am Workflow teilnehmen, weil ihre
Inhalte Abläufe steuern können (z.B. Besprechungsprotokolle,
Formularwesen des Qualitätsmanagements), oder sie können
ihre Inhalte selektiv, kontextbezogen und zielgruppengerecht präsentieren.
Aus Sicht des Informationsmanagements kommt bei XML-Grafiken
(SVG) noch ein weiterer Vorteil hinzu: Wegen der XML-bedingten
Automatisierbarkeit wird es technisch und wirtschaftlich möglich,
nicht nur textuelles Material, sondern auch grafisch aufbereitete
Daten als qualitativ hochwertigen Informationsträger einzusetzen,
z.B. Übersichtsdiagramme, didaktisch aufbereitete interaktive
Darstellungen technischer Zusammenhänge, Präsentation
von Zahlenmaterial, grafische Projektplanungs- und Projektverlaufsunterlagen.
Natürlich ist der flächendeckende Ersatz der etablierten
Office-Anwendungen durch XML-basierte Systeme eine Utopie. Ein
Knackpunkt ist daher die Erschließung von Inhalten aus Office-Dokumenten.

|
Die dot.doc Economy
Wir leben in einer dot.doc Economy: Wesentliche Anteile
des Unternehmenswissens und -gedächtnisses sind in
Office-Dokumenten verborgen. In einer schönen neuen
Welt wären typische Unternehmensdokumente wie Sitzungsprotokolle,
Präsentationen, Beschlussvorlagen, Projekttagebücher,
Produktunterlagen etc. strukturiert in Datenbanken abgelegt,
verschlagwortet, der Inhalt im Ganzen oder in Teilen bedarfsgerecht
zugreifbar, selektierbar, rekombinierbar und medienneutral
publizierbar.
Wirtschaftlich sinnvoll und leistbar ist dies bisher nur
in Einzelfällen (z.B. im Bereich organisatorisch und
inhaltlich anspruchsvoller technischer Dokumentation). In
der typischen Unternehmenskommunikation kann man sich in
den wenigsten Fällen dem Sog der Ad-hoc-Prozesse auf
Basis populärer E-Mail- und Office-Programme entziehen.
Ein Ersatz der vertrauten Office-Lösungen durch rein
XML-basierte Software ist aus heutiger Sicht
nahezu utopisch.
Einer der Faktoren für erfolgreiches Informationsmanagement
ist es daher, Inhalte aus Office-Dokumenten (insbesondere
Microsoft Word) für den nachfolgenden Workflow zu erschließen,
ohne jedoch den Anwender direkt mit der XML-Thematik zu
konfrontieren. Nicht in jedem Anwendungsfall ist dies optimal
möglich, jedoch bieten geeignete Softwaresysteme auf
XML-Basis auch hierfür Lösungen an.
|

Topic Maps Themennetze
Topic Maps werden manchmal plakativ als das "GPS des Informationsuniversums"
beschrieben. So wie eine Landkarte eine schematische Sicht auf
eine reale Landschaft ermöglicht und bestimmte Merkmale der
Landschaft (z.B. Städte, Straßen, Flüsse) markiert,
kann eine Topic Map wichtige Merkmale eines Informationsbestands
festhalten und in Bezug zueinander setzen. So wie ein GPS-Empfänger
die eigene Position auf der Karte feststellt, kann eine Topic
Map die Orientierung in einer virtuellen Welt vernetzter Dokumente
herstellen.
Das klingt etwas exotisch, hat jedoch durchaus praktische und
sehr weit gefächerte Anwendungen: Mit einer Topic Map lassen
sich beispielsweise die klassischen Navigationselemente technischer
Dokumentation (Inhalt, Index, Glossar etc.) in einheitlicher Weise
beschreiben; eine andere Topic Map könnte die inhaltliche
Vernetzung von Artikeln in einem Lexikon ausdrücken (z.B.
Person A wurde geboren in Stadt B, B liegt in Land C, Oper D wurde
komponiert von A, Person E war Zeitgenosse von A) und für
"siehe auch"-Verweise sorgen (andere Werke dieses Komponisten,
andere Städte in diesem Land etc.).
Topic Maps sind recht abstrakte Gebilde. Wo typische XML-Inhalte
(z.B. eine XHTML-Seite oder eine SVG-Datei) noch eine definierte
Optik besitzen und auf Papier druckbar sind, verrichten Topic
Maps ähnlich wie eine relationale Datenbank
ihren Dienst im Hintergrund. Sie werden typischerweise eingesetzt,
um Navigation und Benutzbarkeit von webbasierten Informationssystemen
zu erhöhen, z.B. in Enterprise Information Portals.
Topic Maps sind im Idealfall eine Art ruhender Gegenpol zum dynamischen
Informationsbestand, weil die in ihnen beschriebenen Zusammenhänge
im Gegensatz zu wechselnden Dokumenten langlebig sind und auch
losgelöst von den verknüpften Dokumenten einen Informationsgehalt
haben. Topic Maps kodieren Wissen. Man geht davon aus, dass es
mit Topic Maps möglich sein wird, unterschiedlichste Informationsbestände
logisch miteinander zu vernetzen.

Fazit
Die beste Strategie beim Umgang mit Unternehmensdokumenten ist,
eine möglichst gute Basis für heute verfügbare
Systeme des Informationsmanagements bereitzustellen und damit
zugleich auf Lösungen des Wissensmanagements von morgen vorbereitet
zu sein. XML als technische Basis ist ein wichtiger Schritt in
diese Richtung.
|
Glossar
XML:
Extensible Markup Language. Web-Standard für die normierte
Beschreibung beliebig strukturierter Inhalte. Im Kern ein
universelles und internationales Dateiformat. Oberbegriff
für eine Reihe flankierender (horizontaler) Standards,
insbesondere zur automatischen Verarbeitung von XML-Daten
(z.B. Adressierung, Transformation, Formatierung). Kristallisationspunkt
für unzählige branchenspezifische (vertikale)
Standards der Informationskodierung und des Informationsaustauschs
(z.B. Ersatzteilkataloge, digitale Patientenakten, E-Commerce,
Pressemeldungen, Finanzdienstleistungen, technische Dokumentation
u.v.m.)
SVG:
Scalable Vector Graphics. Neues XML-basiertes Dateiformat
für Vektor- und Rastergrafiken im Bereich Web und Print.
Geeignet für ein breites Spektrum von Anwendungen (z.B.
Illustrationen, Diagramme, Karten/geographische Informationssysteme,
technische Zeichnungen, Webgrafik). Möglichkeit zur
Beschreibung von Animation (z.B. Bewegung und Überblendeffekte)
und Benutzer-Interaktion (z.B. Klicken und Ziehen). Erlaubt
es, bestimmte Methoden des Content Managements und des Content
Engineerings aus dem Textbereich (z.B. Volltextsuche, Übersetzungsmanagement,
Hypertext) auch auf grafische Inhalte anzuwenden.
Topic Maps:
ISO-Standard 13250 für die Kodierung so genannter semantischer
Netze, d.h. konzeptioneller Landkarten (Maps), mit denen
sich ein thematischer Bezug zwischen interessanten Punkten
(Topics) einer Informationslandschaft herstellen lässt.
Ursprünglich für die Verschlagwortung im Verlagsbereich
entwickelt, werden Topic Maps mittlerweile als universelles
Medium für die Beschreibung von Relationen innerhalb
beliebiger Informationsbestände benutzt. Topic Maps
sind zugleich interessante Methodik und Basistechnologie
für Wissensmanagement-Systeme.
XSLT:
Extensible Stylesheet Language Transformations. Programmiersprache
für die Transformation zwischen verschiedenen XML-Datenmodellen.
Bei der Integration von Softwaresystemen ist XSLT weit verbreitet
als Universaladapter für die Übersetzung zwischen
unterschiedlichen Dialekten der Sprache XML.
RDF:
Resource Description Framework. Universeller XML-basierter
Standard für die Katalogisierung von Dokumenten. Ursprünglich
von Netscape für die Beschreibung von Web Channels
entworfen, findet es zunehmend Einsatz im Umfeld webbasierter
Informationssysteme, bei Dokumenten- und Wissensmanagement.
|
Link zu Hintergrundinformationen
Weitere Informationsquellen und Internet-Links zum Thema XML
finden Sie unter http://www.jochen-schwarze.de.

Leserbrief
schreiben
|