| Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews
Visuell
gestütztes Retrieval mit Dokumentenlandkarten
Artikel
erschienen in
Ausgabe Juli/August 2000
Von
Andreas Becks und
Michael Host
Inhaltsübersicht:
Die
in den zahllosen Dokumenten eines Unternehmens enthaltenen Informationen
zu strukturieren und zu organisieren ist eine wesentliche Voraussetzung
für ein effektives Retrieval. Doch wo liegen die inhaltlichen
Zusammenhänge zwischen den einzelnen Dokumenten? Und wo lassen
sich wichtige Informationen verdichten? Automatisch berechnete
Dokumentenlandkarten können dazu beitragen, das Zurechtfinden
in der Flut an Dokumenten zu erleichtern und wertvolle Informationsquellen
zu erschließen.
Stellen
Sie sich auch oft diese Fragen: Welches Wissen liegt in unserer
Firma in dokumentierter Form vor? Welche Informationsquellen lassen
sich isolieren? Welche Querbezüge finden sich in unseren
aufwendigen Dokumentationen, und welche Bereiche werden wodurch
abgedeckt?
Denn
unternehmerisches Wissen liegt nicht nur in den Mitarbeiterköpfen
verborgen, sondern auch in der mitunter überwältigend
umfangreichen Sammlung von Notizen, technischen Unterlagen und
Produktbeschreibungen, Leitlinien, Patenten, Markt- oder Kundeninformationen
eines Unternehmens. Dokumentenmanagement-Systeme (DMS) unterstützen
zwar die strukturierte Verwaltung von Dokumenten, nicht aber den
oft komplexen Analyseprozess, denn inhaltliche Beziehungen jenseits
der Ablagestruktur bleiben häufig weitgehend im Dunkeln.
Dokumente suchen und analysieren
Wie
kann nun das inhaltliche Erschließen einer Dokumentensammlung
unterstützt werden? Herkömmliche Dokumentenmanagement-
und Retrieval-Systeme helfen bei der gezielten Suche. Sie sind
geeignet, das Wiederfinden bereits bekannter Dokumente zu erleichtern,
z.B. den Brief vom 14. April an Fa. Meier & Co, oder unterstützen
die Recherche nach spezifischen Informationen, etwa Dokumenten
zum Thema "Eigenspannungen im Stahlguss".
Geht
es aber um die Aufgabe, das über die Jahre wachsende Wissenslager
des Unternehmens zu pflegen und zu strukturieren, so steht der
Suchende einem anderen Problem gegenüber: Sein Suchziel ist
oft unklar oder a priori kaum formulierbar. Ziel ist ja gerade
zu entdecken, was an Informationen wo und wie vorhanden ist.
Stellen
Sie sich vor, Sie suchen nach allen Informationen, die mit Stahlgusstechnologie
in Ihrer Firma zusammenhängen. Die lange Liste von möglicherweise
interessanten Dokumenten zu durchforsten und in ihrer Komplexität
zu begreifen, ist sicherlich aufwendig und ohne geeignete Hilfestellung
nur schwer zu bewältigen. Zwei typische Szenarien aus der
Arbeit mit unternehmensinterner Dokumentation machen dies im Folgenden
deutlich.
 |
|
Die
verschiedenen Typen der Dokumentensuche und -analyse
|
Szenario 1:
Produktdokumentation erstellen
Zu
einem komplexen technischen Produkt soll eine Benutzerdokumentation
erstellt werden. In der Praxis geht es nun zunächst darum,
sämtliches verfügbares Material zu sammeln, das bei
der Beschreibung hilfreich sein kann, z.B. Pflichtenhefte, vorhandene
Alt-Dokumentation, Informationen aus dem Support, Entwickler-Notizen,
Release Notes usw.
Die
technische Redaktion muss sich anschließend in diesen Bestand
einarbeiten, Themenfelder lokalisieren, Zusammenhänge begreifen
und die vorhandenen Informationen verdichten. Keine leichte Aufgabe,
wenn es sich um einen umfangreichen Informationsbestand handelt.
Denn die typische Frage bei der redaktionellen Bearbeitung eines
Kapitels lautet: "In welchen Dokumenten des Altbestandes
finde ich weitere Informationen zum gerade zu bearbeitenden Thema?"
Und schon geht die Suche los...
Hilfreich
wäre hier so etwas wie eine Übersichtskarte, die automatisch
Hinweise auf Dokumente mit ähnlichem Inhalt liefert. Diese
Dokumente könnten dann gezielt im Hinblick auf ihre Verwertbarkeit
für das aktuelle Kapitel untersucht werden.
Szenario 2:
Inventur im Intranet
Eine
ähnliche Situation ergibt sich im firmeneigenen Intranet
oder DMS. Auch hier sammeln sich über die Zeit viele wertvolle
Dokumente an. Allerdings verläuft die Ablage oft nicht so
strukturiert wie geplant: Unter Zeitdruck werden Dokumente falsch
eingeordnet und Texte nicht mit der notwendigen Sorgfalt indexiert,
so dass sie in wichtigen Kontexten häufig nicht zugreifbar
sind. Oft werden Klagen laut: "Wir müssen uns schon
sehr gut auskennen, um überhaupt noch irgendetwas zu finden".
Und
so werden Dokumente mit verwandtem Inhalt doppelt erzeugt und
an den unterschiedlichsten Stellen abgelegt. Für ein effektives
Wissensmanagement wird es hier nötig, in regelmäßigen
Abständen aufzuräumen, eine Bestandsaufnahme durchzuführen
und das vorhandene Material zu verdichten.
Das Konzept der Dokumentenlandkarten
Die
oben beschriebenen Aufgaben erfordern einen explorativen Zugang
zur Dokumentensammlung, der es ermöglicht, die inhaltliche
Struktur des Bestandes jenseits vergebener Schlagwörter und
Suchpfade zu erkennen und jedes Dokument in seinen Kontext zu
stellen. Exploration setzt semantische Zugriffspfade voraus
inhaltliche Wege durch die dichte Informationslandschaft. Gut
wäre es, wenn sich die inhaltlichen Strukturen der Dokumentenablage
vor den Augen des Betrachters erschließen und die Querbezüge
zwischen den einzelnen Dokumenten sichtbar würden. Doch wie
kann ein Werkzeug aussehen, das hier hilft?
Dokumentenlandkarten
sind eine neuartige Möglichkeit, die inhaltlichen Beziehungen
zwischen unstrukturierten Dokumenten und Dokumentengruppen intuitiv
durch eine grafische Darstellung zu veranschaulichen. Ob die Textsammlungen
dabei als Punktwolken dargestellt werden oder ob ansprechendere
Metaphern zum Einsatz kommen das Prinzip ist immer gleich:
Die Abstände einzelner Punkte und die Dichte der Dokumente
auf der Karte sollen einen Eindruck von der Ähnlichkeit der
Texte vermitteln. Ob ein Punkt einen einzelnen Sinnabschnitt,
ein Kapitel oder ein komplettes Dokument umfasst, hängt letztlich
von der Natur der Texte und der Aufgabenstellung ab.
Das interaktive Dokumentenlandkarten-System DocMINER
Am
Lehrstuhl für Informationssysteme der RWTH Aachen wird das
Konzept der Dokumentenlandkarten für die Analyse spezialisierter
Textsammlungen untersucht. Im Rahmen dieses Projektes wurde das
interaktive Dokumentenlandkarten-System DocMINER entwickelt.
DocMINER
berechnet automatisch aus den eingegebenen Dokumenten eine thematische
Übersichtskarte, die einen Eindruck über die inhaltliche
Struktur der Textsammlung vermittelt. Die Texte werden hierfür
zunächst durch statistisch-linguistische Verfahren analysiert
und miteinander verglichen. Der Benutzer hat zudem die Möglichkeit,
Regeln zum Verfeinern der automatischen Strukturierung anzugeben.
Damit kann er für ihn interessante, bislang aber unberücksichtigte
Beziehungen zwischen Dokumenten definieren. Für die Visualisierung
der inhaltlichen Strukturen wurde schließlich ein Verfahren
gewählt, das die Topologie des Dokumentenraums, also die
inhaltlichen Verwandtschaftsbeziehungen, auf eine zweidimensionale
Karte abbildet.
 |
|
Interaktion
mit einer Dokumentenlandkarte: inhaltliche Dokumentenbezüge
visuell erfassen und analysieren
(Zum Vergrößern bitte auf das Bild klicken.)
|
Mit einer Dokumentenlandkarte arbeiten
Wie
ist nun eine von DocMINER erzeugte Dokumentenlandkarte zu verstehen?
Die Visualisierungsmetapher lässt sich mit ein wenig
Übung leicht einsehen: Benachbarte Dokumente, dargestellt
durch grafische Symbole, behandeln verwandte Inhalte. Je stärker
sich die Texte thematisch unterscheiden, desto weiter liegen sie
auch auf der Karte entfernt. Dieser Eindruck wird zusätzlich
ähnlich einer Höhenkarte durch eine Farbverteilung
gestärkt: Gruppen verwandter Dokumente liegen in gemeinsamen,
hellen Tälern und werden durch dunkle, unterschiedlich hohe
Berge getrennt. Je dunkler die Hintergrundfarbe, desto stärker
liegen die Gruppen inhaltlich auseinander.
Eine
Dokumentenlandkarte ist als visuelle Darstellung zunächst
passiv. Zwar ist die globale Struktur des Dokumentenraums schon
auf einen Blick erkennbar und offenbart bereits interessante Eigenschaften
der Textsammlung (z.B.: Wie viele thematische Gruppen finden sich?
Wie hängen diese Gruppen zusammen?). Zu einem echten Hilfsmittel
wird das Kartensystem aber erst durch seine interaktiven Komponenten:
- Detailinformationen
abrufen:
Durch Klicken auf die Dokumentensymbole, die durch die Titel
der Dokumente oder einen selbstdefinierten Namen beschriftet
werden können, werden die zugehörigen Texte geöffnet.
Das gewählte Dokument wird gleichzeitig in der Karte optisch
hervorgehoben (in der Abbildung: große Karte, Mitte).
- Schlagwörter
ermitteln:
Um den Inhalt einer beliebigen Dokumentengruppe zu charakterisieren,
kann z.B. die Verteilung der relevanten Schlagwörter berechnet
und angezeigt werden (rechtes Fenster in der Abbildung).
- Fokussieren:
Der Benutzer kann interessante Teilbereiche der Karte ausschneiden
und skalieren (Fenster links oben in der Abbildung). Eng benachbarte
Punkte rücken dabei auseinander und ermöglichen so,
die lokalen Strukturen feiner zu untersuchen.
- Anreichern
mit Informationen:
Für die Dokumentenpunkte können verschiedene grafische
Symbole festgelegt werden. Auf diese Weise ist es möglich,
vorgegebene Kategorien oder auch während der Arbeit gebildete
Klassen optisch hervorzuheben. Zudem kann der Benutzer zu jedem
Dokument Kommentare hinterlegen oder interessante Gebiete durch
Fähnchen markieren.
- Dokumente
gezielt suchen:
Hierzu gibt es verschiedene Möglichkeiten: Neben einer
Volltextsuche können auch Suchterme aus einem automatisch
generierten Index angegeben, gewichtet und verknüpft werden
(Fenster links unten in der Abbildung). Als Ergebnis erhält
der Suchende nicht nur eine Liste der gefundenen Texte; auch
die entsprechenden Punkte auf der Karte werden hervorgehoben
(helle, konzentrische Rechtecke in der Karte) und ermöglichen
es so, die Ergebnisse in ihrem Kontext zu begreifen. Damit ist
es leicht möglich, auch inhaltlich verwandte, aber nicht
durch die Anfrage erfasste Dokumente auf ihre Relevanz zu untersuchen.
- Dokumente
hinzufügen:
Schließlich können statt einer Anfrage auch ganze
Dokumente auf die Karte abgebildet werden. Das Ergebnis ist
ein neuer Dokumentenpunkt, dessen Kontext dann auf ähnliches,
interessantes Material untersucht werden kann.
Dokumentenlandkarten im Einsatz
Diese zunächst
etwas abstrakt erscheinenden Beschreibungen sollen an einem kleinen
Beispiel verdeutlicht werden. Wir haben exemplarisch Benutzeranleitungen
für eine technische Software untersucht (Magmasoft Version
3.2). Alle Manuals zu dieser Software wurden mit DocMINER ausgewertet
einschließlich der Beschreibung einzelner Softwaremodule,
der zugehörigen Online-Hilfe sowie einem Tutorial, das in
die Software einführt. Die Dokumente wurden in einzelne Sinnabschnitte
(= Unterkapitel) zerlegt, die letztlich einen Punkt in der Dokumentenlandkarte
repräsentieren. Die gesamte Kollektion umfasst 679 Dokumente
mit durchschnittlich 225 Worten.
Das Ergebnis
der Auswertung mit DocMINER zeigt die Abbildung. Die Art der Dokumentenquelle
(Manual, Tutorial, Online-Hilfe) ist durch ein Symbol wie
im Legendenfenster "Color Definitions" angegeben
gekennzeichnet. Aus der Abbildung lassen sich folgende Erkenntnisse
ableiten:
- Zunächst
finden sich tatsächlich die Dokumente zu einem bestimmten
Softwaremodul in einem bestimmten Bereich der Karte wieder.
Beispielsweise liegen einige Dokumente des Moduls "Steel"
in dem markierten Bereich (helles Auswahlrechteck), die übrigen
finden sich südwestlich davon.
- Außerdem
zeigt die Karte eine interessante Verteilung der Dokumente zur
Online-Hilfe: In der näheren Umgebung der meisten Manual-Dokumente
findet sich auch ein Online-Dokument mit jeweils verwandtem
Inhalt. Da die Online-Hilfe gesondert aufgebaut und nicht unmittelbar
aus dem Manual-Text generiert wurde, ist dieser Abstand nicht
weiter verwunderlich. Nur sehr ähnliche oder inhaltlich
identische Dokumente fallen auf einem Dokumentenpunkt zusammen.
- Der Röntgenblick
in den Dokumentenbestand ermöglicht es dem Benutzer, die
Berücksichtigung des Single-Source-Prinzips (ein Thema
entspricht einer Quelle) auf einen Blick zu prüfen, ohne
dazu aufwendig viele Textpassagen aus unterschiedlichen Dokumenten
suchen und lesen zu müssen.
Die Dokumentenlandkarte
offenbart noch eine weitere Erkenntnis: Während zu den meisten
Manual-Themen eine Online-Hilfe existiert, ist das Tutorial auf
einige wenige Manual-Themen beschränkt. Auch dies entspricht
der Realität, denn das Tutorial hat vorrangig den Anspruch,
Neueinsteigern den Start zu erleichtern und nicht das komplette
Manual mit Beispielen abzubilden. Dennoch: Wäre das Ziel,
im Bereich Tutorial noch etwas zu tun, könnte die DocMINER-Karte
wichtige Hinweise auf weiße Flecken in der Dokumentenlandschaft
liefern.
Fazit
Dokumentenlandkarten
können erfolgreich inhaltliche Zusammenhänge in komplexen
Textsammlungen visualisieren. In Kombination mit verschiedenen
Suchmethoden wie in DocMINER realisiert stellen
sie damit ein interessantes und wichtiges Werkzeug für ein
effektives Retrieval dar.
Ihre
Einsatzmöglichkeiten sind vielfältig und hier nur teilweise
skizziert. Im Zusammenspiel mit DMS eröffnen Dokumentenlandkarten
die Perspektive, im Unternehmen vorhandenes dokumentiertes Wissen
fruchtbarer als bisher zu nutzen.
|