Fachbücher

 
  Programm
Appetithappen
Bestellung

 

doculine Archiv

  Übersicht
Index
Autoren
Streifzüge

 
 

Service

 
  transline tecNews
Suche
Impressum
 

Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews

Visuell gestütztes Retrieval mit Dokumentenlandkarten

 

Artikel erschienen in
Ausgabe Juli/August 2000

Von Andreas Becks und Michael Host

Inhaltsübersicht:

Die in den zahllosen Dokumenten eines Unternehmens enthaltenen Informationen zu strukturieren und zu organisieren ist eine wesentliche Voraussetzung für ein effektives Retrieval. Doch wo liegen die inhaltlichen Zusammenhänge zwischen den einzelnen Dokumenten? Und wo lassen sich wichtige Informationen verdichten? Automatisch berechnete Dokumentenlandkarten können dazu beitragen, das Zurechtfinden in der Flut an Dokumenten zu erleichtern und wertvolle Informationsquellen zu erschließen.

Stellen Sie sich auch oft diese Fragen: Welches Wissen liegt in unserer Firma in dokumentierter Form vor? Welche Informationsquellen lassen sich isolieren? Welche Querbezüge finden sich in unseren aufwendigen Dokumentationen, und welche Bereiche werden wodurch abgedeckt?

Denn unternehmerisches Wissen liegt nicht nur in den Mitarbeiterköpfen verborgen, sondern auch in der mitunter überwältigend umfangreichen Sammlung von Notizen, technischen Unterlagen und Produktbeschreibungen, Leitlinien, Patenten, Markt- oder Kundeninformationen eines Unternehmens. Dokumentenmanagement-Systeme (DMS) unterstützen zwar die strukturierte Verwaltung von Dokumenten, nicht aber den oft komplexen Analyseprozess, denn inhaltliche Beziehungen jenseits der Ablagestruktur bleiben häufig weitgehend im Dunkeln.


Dokumente suchen und analysieren

Wie kann nun das inhaltliche Erschließen einer Dokumentensammlung unterstützt werden? Herkömmliche Dokumentenmanagement- und Retrieval-Systeme helfen bei der gezielten Suche. Sie sind geeignet, das Wiederfinden bereits bekannter Dokumente zu erleichtern, z.B. den Brief vom 14. April an Fa. Meier & Co, oder unterstützen die Recherche nach spezifischen Informationen, etwa Dokumenten zum Thema "Eigenspannungen im Stahlguss".

Geht es aber um die Aufgabe, das über die Jahre wachsende Wissenslager des Unternehmens zu pflegen und zu strukturieren, so steht der Suchende einem anderen Problem gegenüber: Sein Suchziel ist oft unklar oder a priori kaum formulierbar. Ziel ist ja gerade zu entdecken, was an Informationen wo und wie vorhanden ist.

Stellen Sie sich vor, Sie suchen nach allen Informationen, die mit Stahlgusstechnologie in Ihrer Firma zusammenhängen. Die lange Liste von möglicherweise interessanten Dokumenten zu durchforsten und in ihrer Komplexität zu begreifen, ist sicherlich aufwendig und ohne geeignete Hilfestellung nur schwer zu bewältigen. Zwei typische Szenarien aus der Arbeit mit unternehmensinterner Dokumentation machen dies im Folgenden deutlich.

Die verschiedenen Typen der Dokumentensuche und -analyse


Szenario 1:
Produktdokumentation erstellen

Zu einem komplexen technischen Produkt soll eine Benutzerdokumentation erstellt werden. In der Praxis geht es nun zunächst darum, sämtliches verfügbares Material zu sammeln, das bei der Beschreibung hilfreich sein kann, z.B. Pflichtenhefte, vorhandene Alt-Dokumentation, Informationen aus dem Support, Entwickler-Notizen, Release Notes usw.

Die technische Redaktion muss sich anschließend in diesen Bestand einarbeiten, Themenfelder lokalisieren, Zusammenhänge begreifen und die vorhandenen Informationen verdichten. Keine leichte Aufgabe, wenn es sich um einen umfangreichen Informationsbestand handelt. Denn die typische Frage bei der redaktionellen Bearbeitung eines Kapitels lautet: "In welchen Dokumenten des Altbestandes finde ich weitere Informationen zum gerade zu bearbeitenden Thema?" Und schon geht die Suche los...

Hilfreich wäre hier so etwas wie eine Übersichtskarte, die automatisch Hinweise auf Dokumente mit ähnlichem Inhalt liefert. Diese Dokumente könnten dann gezielt im Hinblick auf ihre Verwertbarkeit für das aktuelle Kapitel untersucht werden.


Szenario 2:
Inventur im Intranet

Eine ähnliche Situation ergibt sich im firmeneigenen Intranet oder DMS. Auch hier sammeln sich über die Zeit viele wertvolle Dokumente an. Allerdings verläuft die Ablage oft nicht so strukturiert wie geplant: Unter Zeitdruck werden Dokumente falsch eingeordnet und Texte nicht mit der notwendigen Sorgfalt indexiert, so dass sie in wichtigen Kontexten häufig nicht zugreifbar sind. Oft werden Klagen laut: "Wir müssen uns schon sehr gut auskennen, um überhaupt noch irgendetwas zu finden".

Und so werden Dokumente mit verwandtem Inhalt doppelt erzeugt und an den unterschiedlichsten Stellen abgelegt. Für ein effektives Wissensmanagement wird es hier nötig, in regelmäßigen Abständen aufzuräumen, eine Bestandsaufnahme durchzuführen und das vorhandene Material zu verdichten.


Das Konzept der Dokumentenlandkarten

Die oben beschriebenen Aufgaben erfordern einen explorativen Zugang zur Dokumentensammlung, der es ermöglicht, die inhaltliche Struktur des Bestandes jenseits vergebener Schlagwörter und Suchpfade zu erkennen und jedes Dokument in seinen Kontext zu stellen. Exploration setzt semantische Zugriffspfade voraus – inhaltliche Wege durch die dichte Informationslandschaft. Gut wäre es, wenn sich die inhaltlichen Strukturen der Dokumentenablage vor den Augen des Betrachters erschließen und die Querbezüge zwischen den einzelnen Dokumenten sichtbar würden. Doch wie kann ein Werkzeug aussehen, das hier hilft?

Dokumentenlandkarten sind eine neuartige Möglichkeit, die inhaltlichen Beziehungen zwischen unstrukturierten Dokumenten und Dokumentengruppen intuitiv durch eine grafische Darstellung zu veranschaulichen. Ob die Textsammlungen dabei als Punktwolken dargestellt werden oder ob ansprechendere Metaphern zum Einsatz kommen – das Prinzip ist immer gleich: Die Abstände einzelner Punkte und die Dichte der Dokumente auf der Karte sollen einen Eindruck von der Ähnlichkeit der Texte vermitteln. Ob ein Punkt einen einzelnen Sinnabschnitt, ein Kapitel oder ein komplettes Dokument umfasst, hängt letztlich von der Natur der Texte und der Aufgabenstellung ab.


Das interaktive Dokumentenlandkarten-System DocMINER

Am Lehrstuhl für Informationssysteme der RWTH Aachen wird das Konzept der Dokumentenlandkarten für die Analyse spezialisierter Textsammlungen untersucht. Im Rahmen dieses Projektes wurde das interaktive Dokumentenlandkarten-System DocMINER entwickelt.

DocMINER berechnet automatisch aus den eingegebenen Dokumenten eine thematische Übersichtskarte, die einen Eindruck über die inhaltliche Struktur der Textsammlung vermittelt. Die Texte werden hierfür zunächst durch statistisch-linguistische Verfahren analysiert und miteinander verglichen. Der Benutzer hat zudem die Möglichkeit, Regeln zum Verfeinern der automatischen Strukturierung anzugeben. Damit kann er für ihn interessante, bislang aber unberücksichtigte Beziehungen zwischen Dokumenten definieren. Für die Visualisierung der inhaltlichen Strukturen wurde schließlich ein Verfahren gewählt, das die Topologie des Dokumentenraums, also die inhaltlichen Verwandtschaftsbeziehungen, auf eine zweidimensionale Karte abbildet.

Interaktion mit einer Dokumentenlandkarte: inhaltliche Dokumentenbezüge visuell erfassen und analysieren
(Zum Vergrößern bitte auf das Bild klicken.)

 


Mit einer Dokumentenlandkarte arbeiten

Wie ist nun eine von DocMINER erzeugte Dokumentenlandkarte zu verstehen? Die Visualisierungsmetapher lässt sich – mit ein wenig Übung – leicht einsehen: Benachbarte Dokumente, dargestellt durch grafische Symbole, behandeln verwandte Inhalte. Je stärker sich die Texte thematisch unterscheiden, desto weiter liegen sie auch auf der Karte entfernt. Dieser Eindruck wird zusätzlich – ähnlich einer Höhenkarte – durch eine Farbverteilung gestärkt: Gruppen verwandter Dokumente liegen in gemeinsamen, hellen Tälern und werden durch dunkle, unterschiedlich hohe Berge getrennt. Je dunkler die Hintergrundfarbe, desto stärker liegen die Gruppen inhaltlich auseinander.

Eine Dokumentenlandkarte ist als visuelle Darstellung zunächst passiv. Zwar ist die globale Struktur des Dokumentenraums schon auf einen Blick erkennbar und offenbart bereits interessante Eigenschaften der Textsammlung (z.B.: Wie viele thematische Gruppen finden sich? Wie hängen diese Gruppen zusammen?). Zu einem echten Hilfsmittel wird das Kartensystem aber erst durch seine interaktiven Komponenten:

  • Detailinformationen abrufen:
    Durch Klicken auf die Dokumentensymbole, die durch die Titel der Dokumente oder einen selbstdefinierten Namen beschriftet werden können, werden die zugehörigen Texte geöffnet. Das gewählte Dokument wird gleichzeitig in der Karte optisch hervorgehoben (in der Abbildung: große Karte, Mitte).
  • Schlagwörter ermitteln:
    Um den Inhalt einer beliebigen Dokumentengruppe zu charakterisieren, kann z.B. die Verteilung der relevanten Schlagwörter berechnet und angezeigt werden (rechtes Fenster in der Abbildung).
  • Fokussieren:
    Der Benutzer kann interessante Teilbereiche der Karte ausschneiden und skalieren (Fenster links oben in der Abbildung). Eng benachbarte Punkte rücken dabei auseinander und ermöglichen so, die lokalen Strukturen feiner zu untersuchen.
  • Anreichern mit Informationen:
    Für die Dokumentenpunkte können verschiedene grafische Symbole festgelegt werden. Auf diese Weise ist es möglich, vorgegebene Kategorien oder auch während der Arbeit gebildete Klassen optisch hervorzuheben. Zudem kann der Benutzer zu jedem Dokument Kommentare hinterlegen oder interessante Gebiete durch Fähnchen markieren.
  • Dokumente gezielt suchen:
    Hierzu gibt es verschiedene Möglichkeiten: Neben einer Volltextsuche können auch Suchterme aus einem automatisch generierten Index angegeben, gewichtet und verknüpft werden (Fenster links unten in der Abbildung). Als Ergebnis erhält der Suchende nicht nur eine Liste der gefundenen Texte; auch die entsprechenden Punkte auf der Karte werden hervorgehoben (helle, konzentrische Rechtecke in der Karte) und ermöglichen es so, die Ergebnisse in ihrem Kontext zu begreifen. Damit ist es leicht möglich, auch inhaltlich verwandte, aber nicht durch die Anfrage erfasste Dokumente auf ihre Relevanz zu untersuchen.
  • Dokumente hinzufügen:
    Schließlich können statt einer Anfrage auch ganze Dokumente auf die Karte abgebildet werden. Das Ergebnis ist ein neuer Dokumentenpunkt, dessen Kontext dann auf ähnliches, interessantes Material untersucht werden kann.


Dokumentenlandkarten im Einsatz

Diese zunächst etwas abstrakt erscheinenden Beschreibungen sollen an einem kleinen Beispiel verdeutlicht werden. Wir haben exemplarisch Benutzeranleitungen für eine technische Software untersucht (Magmasoft Version 3.2). Alle Manuals zu dieser Software wurden mit DocMINER ausgewertet – einschließlich der Beschreibung einzelner Softwaremodule, der zugehörigen Online-Hilfe sowie einem Tutorial, das in die Software einführt. Die Dokumente wurden in einzelne Sinnabschnitte (= Unterkapitel) zerlegt, die letztlich einen Punkt in der Dokumentenlandkarte repräsentieren. Die gesamte Kollektion umfasst 679 Dokumente mit durchschnittlich 225 Worten.

Das Ergebnis der Auswertung mit DocMINER zeigt die Abbildung. Die Art der Dokumentenquelle (Manual, Tutorial, Online-Hilfe) ist durch ein Symbol – wie im Legendenfenster "Color Definitions" angegeben – gekennzeichnet. Aus der Abbildung lassen sich folgende Erkenntnisse ableiten:

  • Zunächst finden sich tatsächlich die Dokumente zu einem bestimmten Softwaremodul in einem bestimmten Bereich der Karte wieder. Beispielsweise liegen einige Dokumente des Moduls "Steel" in dem markierten Bereich (helles Auswahlrechteck), die übrigen finden sich südwestlich davon.
  • Außerdem zeigt die Karte eine interessante Verteilung der Dokumente zur Online-Hilfe: In der näheren Umgebung der meisten Manual-Dokumente findet sich auch ein Online-Dokument mit jeweils verwandtem Inhalt. Da die Online-Hilfe gesondert aufgebaut und nicht unmittelbar aus dem Manual-Text generiert wurde, ist dieser Abstand nicht weiter verwunderlich. Nur sehr ähnliche oder inhaltlich identische Dokumente fallen auf einem Dokumentenpunkt zusammen.
  • Der Röntgenblick in den Dokumentenbestand ermöglicht es dem Benutzer, die Berücksichtigung des Single-Source-Prinzips (ein Thema entspricht einer Quelle) auf einen Blick zu prüfen, ohne dazu aufwendig viele Textpassagen aus unterschiedlichen Dokumenten suchen und lesen zu müssen.

Die Dokumentenlandkarte offenbart noch eine weitere Erkenntnis: Während zu den meisten Manual-Themen eine Online-Hilfe existiert, ist das Tutorial auf einige wenige Manual-Themen beschränkt. Auch dies entspricht der Realität, denn das Tutorial hat vorrangig den Anspruch, Neueinsteigern den Start zu erleichtern und nicht das komplette Manual mit Beispielen abzubilden. Dennoch: Wäre das Ziel, im Bereich Tutorial noch etwas zu tun, könnte die DocMINER-Karte wichtige Hinweise auf weiße Flecken in der Dokumentenlandschaft liefern.


Fazit

Dokumentenlandkarten können erfolgreich inhaltliche Zusammenhänge in komplexen Textsammlungen visualisieren. In Kombination mit verschiedenen Suchmethoden – wie in DocMINER realisiert – stellen sie damit ein interessantes und wichtiges Werkzeug für ein effektives Retrieval dar.

Ihre Einsatzmöglichkeiten sind vielfältig und hier nur teilweise skizziert. Im Zusammenspiel mit DMS eröffnen Dokumentenlandkarten die Perspektive, im Unternehmen vorhandenes dokumentiertes Wissen fruchtbarer als bisher zu nutzen.

  Doculine durchsuchen:   

  

Empfehlenswerte Seiten zur technischen Übersetzung
von transline - Übersetzungsdienst für technische Übersetzung
technische Übersetzungen | Übersetzung Software | Software Lokalisierung
Spez. Seiten zu Sprachen
Chinesisch Übersetzung | Englisch Übersetzung | Französisch Übersetzung | Niederländisch Übersetzung | Russisch Übersetzung | Spanisch Übersetzung | Portugiesisch Übersetzung | Italienisch Übersetzung | Japanisch Übersetzung
Infos zum Übersetzungsservice transline

Übersetzungen Ihrer Patente - Dr. Sturz Patentübersetzungen

Letzte Änderung: 31.10.2005 | Presse-Service | Disclaimer
© doculine Verlags-GmbH, ein Unternehmen der transline Gruppe