|
Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews
Am Ariadne-Faden durch die Welt von Thomas Mann
Artikel
erschienen in
Ausgabe April 2001
Von
Gabriele Vollmar
Inhaltsübersicht:
Im
Jahr 2025 werden die Rechte an den Werken von Thomas Mann frei.
Die bis dahin noch verbleibende Zeit will der S. Fischer Verlag,
der bisher die Rechte hält, nutzen, um einen Vorsprung vor
der dann aktiv werdenden Konkurrenz zu erarbeiten. Der Verlag
hat sich deshalb die Frage nach den eigenen Stärken gestellt
und dabei erkannt, dass die Konkurrenzfähigkeit im enormen
Wissen um Thomas Mann und seine Werke begründet ist. Dieser
Schatz soll nun mit der geplanten Großen kommentierten Frankfurter
Ausgabe (GKFA), der dann verbindlichen Referenzausgabe, gehoben
werden. Doch wie können der riesige Text-Korpus und dessen
Wissenskontext zugänglich gemacht werden?
Die elektronische Ausgabe: mehr als ein Nebenprodukt
Schon
seit den 90er Jahren ist es üblich, bei Großprojekten
neben einer Buch- auch eine elektronische Ausgabe zu publizieren.
Allerdings hatte dabei bisher die Buchausgabe unbedingten Vorrang;
die elektronische Ausgabe entstand oftmals erst nach deren Abschluss
und auf deren Datenbasis. Das Ergebnis: elektronisches Papier.
In den meisten Fällen bietet lediglich eine Volltextsuche
eine ungefähre Annäherung an die Möglichkeiten
der neuen Medien.
Im
Hinblick auf die lange Laufzeit des Thomas-Mann-Projektes
bis 2015 sollen jährlich zwei bis drei Bände erscheinen
wollte der S. Fischer Verlag mit der Publikation der CD-ROM
nicht bis zum Abschluss der Buchausgabe warten. Daraus ergab sich
jedoch ein Problem: Wie kann man schon heute einen Standard setzen,
der auch im schnelllebigen Electronic Publishing die nächsten
zehn bis fünfzehn Jahre dauern wird? "Uns war klar,
dass wir die unterschiedliche Qualität der Medien berücksichtigen
müssen. Kein Mensch wird je die Buddenbrooks
am Bildschirm lesen wollen", meint Roland Spahr, Lektor beim
S. Fischer Verlag und als Koordinator im Bereich Klassische Moderne
verantwortlich für das Thomas-Mann-Projekt.
Die
Ansprüche an das Projekt lauteten deshalb:
- medienunabhängiges Vorhalten der Daten im SGML/XML-Format
- Nutzen der technischen Möglichkeiten der CD-ROM durch
ein intelligentes, inhaltlich ausgerichtetes Recherchemodul
- Visualisieren von zeitlichen Zusammenhängen und statistischen
Häufigkeiten
- Erstellen von thematisch zusammengestellten Spin-off-Produkten
auf der Grundlage der vorhandenen Textbasis
In
einer Umkehrung bisheriger Hierarchien soll nun die gesamte Buchausgabe
Teil der parallel erscheinenden elektronischen Ausgabe sein. Dort
wo Verkürzungen dem Medium Buch zuzuschreiben sind, z.B.
in der nur zusammenfassenden Wiedergabe einer Rede Thomas Manns
im Kommentar, können diese in der elektronischen Ausgabe
aufgelöst werden, indem z.B. diese Rede als Tondokument zu
hören sein wird. Im Hinblick auf die Zitierbarkeit und Wissenschaftlichkeit
der als Referenzausgabe geplanten GKFA wird es auf der CD-ROM
jedoch einen eigentlichen GKFA-Bereich und einen davon abgesetzten
Archiv-Bereich geben. In diesem Bereich stehen Texte, die nicht
unmittelbar Bestandteil der Edition sind (z.B. Briefregister,
Notizbücher). Darüber hinaus wird Kulinarisches aus
dem großen Fischer-Fundus präsentiert, wie z.B. Bilder
und Tondokumente.

Ein Wissensnetz wird geknüpft
Der
Text-Korpus bei Thomas Mann ist sehr umfangreich: Er umfasst neben
den acht Romanen und zahlreichen Erzählungen auch noch etwa
1.200 Essays und schätzungsweise an die 25.000 Briefe. Eine
reine Volltextsuche bietet hier nur einen wenig zufriedenstellenden
Zugang. Denn Meta-Informationen, wie sie gerade im Falle der Essays
in großer Zahl vorliegen, oder auch die z.T. komplexe Überlieferungslage
der Texte sind so nicht effizient recherchier- und auswertbar.
Vielmehr muss hierzu der riesige Textbestand bereits vorstrukturiert,
die Information vorab klassifiziert werden. "Ein Wissensnetz
nötigte sich irgendwann als Lösung fast schon auf",
berichtet Roland Spahr.
Das
Wissensnetz oder auch semantische Netz liegt als Meta-Struktur
über dem eigentlichen Datenbestand. Wir unterscheiden somit
drei Ebenen:
- Textvorkommen
- Individuen
- Konzepte
Über
die Ebene der Individuen und der Konzepte wird das eigentliche
Textvorkommen strukturiert und erschlossen. Das abstrakte Modell
der Objekte und Relationen auf der Konzeptebene dient als Raster
für die Einordnung der Individualobjekte. Es erlaubt z.B.,
die Person Thomas Mann mit dem Konzept des Schriftstellers zu
verbinden oder das Objekt "Zauberberg" mit dem des Romans.
In einem weiteren Schritt können nun diese miteinander verbunden
werden: "Thomas Mann hat den Roman Zauberberg
geschrieben".
 |
Die
Struktur des Wissensnetzes
(Layout von VIA Informationsarchitekturen) |
In
einem ersten Schritt werden die Texte im SGML- bzw. XML-Format
aufbereitet und strukturiert. Der so genannte Informationspool
dient dann als strukturierte Datenbasis für Publikationen
aller Art. Darüber wird mit Hilfe des vorhandenen Registers
ein erstes semantisches Netz automatisch erstellt. Register, die
es dem Leser ermöglichen nach bestimmten Begriffen zu suchen,
sind stark formalisiert und daher gut auszuwerten. Das erste rudimentäre
Netz wird manuell weiter gefüllt und stärker verknüpft.
Dabei hilft das so genannte Mark-Up-Tool der Wissensmanagement-Suite
K-Infinity vom Projektpartner intelligent views, das die Texte
auszeichnet und damit Vorschläge für neue Wissensobjekte,
z.B. mehrmals vorkommende Personen- und Ortsnamen, macht. Die
automatische Auszeichnung erfolgt aufgrund definierter linguistischer
Regeln, Statistiken oder auch spezialisierter Wörterbücher.
Die
Entscheidung darüber, welche Objekte aufgenommen werden bzw.
welche Relationen zwischen Objekten etabliert werden, liegt alleine
beim Lektorat. Denn viele Köche verderben den Brei und viele
Spinnen verwirren das Netz. "Wir haben Redaktionsrichtlinien
über die Aufnahme neuer Objekte und neuer Relationen festgelegt.
Dabei ist der Kommentar des Herausgebers ausschlaggebend. Wichtig
ist, dass wir uns in unseren Entscheidungen auf Standard-Werke
wie z.B. das Kindler-Literaturlexikon berufen können",
erläutert Roland Spahr das Vorgehen der Redaktion.

Wer kennt Mynheer Peeperkorn?
"Das
semantische Netz eröffnet neue Zugänge zum Werk Thomas
Manns und erlaubt es, neue Fragen zu stellen", ist Karl Sorg,
Knowledge Engineer beim Projektpartner intelligent views überzeugt.
In der Tat erlaubt die Erschließung der Texte über
die Meta-Ebene Fragen zu stellen, wie z.B.:
- In welchen Essays hat Thomas Mann über Musik geschrieben?
- Mit welchen anderen Autoren stand Thomas Mann in Briefkontakt?
- In welchen Briefen spricht Thomas Mann über den "Doktor
Faustus"?
Natürlich
sind die Antworten auf diese Fragen in den Texten selbst enthalten.
Doch die in der Literatur im Gegensatz zu enzyklopädischen
Werken wenig formalisierte Sprache macht eine automatische
Inhaltserschließung quasi unmöglich. In der Vergangenheit
bedeutete dies, sich durch abertausende von Seiten zu lesen. Durch
die Formalisierung von Fakten bei deren Übertragung in das
semantische Netz wird die verborgene Information nun technisch
erschließbar. Auch Prof. Klaus Kloocke, Literaturwissenschaftler
an der Universität Tübingen, steht solchen Entwicklungen
auf dem Feld der Literatur durchaus offen gegenüber: "In
Anbetracht des sehr großen und komplexen Textbestandes ist
eine solche Erschließung sehr wünschenswert. Das Werk
wird dadurch einfach zugänglicher."
Ein
Beispiel: Interessiert sich der Sucher für den Briefwechsel
Thomas Manns mit anderen Schriftstellern zwischen 1910 und 1935,
wird ihm eine Liste der in diesem Zeitraum Angeschriebenen präsentiert.
Wählt er daraus Gerhart Hauptmann, werden alle an diesen
gerichteten Briefe als einfache chronologische Liste oder grafisch
aufbereitet auf einer Zeitleiste dargestellt. Die Visualisierung
zeigt, dass während einer bestimmten Zeitspanne die Korrespondenz
zwischen Mann und Hauptmann sehr rege war. Vielleicht liegt die
Ursache ja in dem Brief, der diesen intensiven Austausch eingeleitet
hat?
 |
Der
Briefwechsel zwischen Thomas Mann und Gerhart Hauptmann war
zwischen 1925 und 1930 besonders intensiv. Warum?
(User Interface von intelligent views, Content von VIA Informationsarchitekturen) |
In
der Tat entschuldigt sich Thomas Mann in diesem Brief bei Gerhart
Hauptmann dafür, dass er der Figur des Mynheer Peeperkorn
im "Zauberberg" in so war zumindest die Meinung
Hauptmanns wenig schmeichelhafter Art und Weise Charakterzüge
des berühmten Schriftstellerkollegen verliehen hat. Eine
in der Visualisierung auffällige Häufung hat den Leser
letztlich zu einem besseren Verständnis der Figur des Mynheer
Peeperkorn im "Zauberberg" geführt.

In der literarischen Welt ist alles möglich
Der
S. Fischer Verlag ist nicht ganz unvertraut mit der Wissensnetz-Technologie:
Für die Herausgabe des Fischer Weltalmanachs wird schon seit
einiger Zeit darauf unterstützend zurückgegriffen. Doch
Enzyklopädien haben fest definierte Strukturen und Formulierungsvorgaben,
Literatur hingegen lebt von der sprachlichen Varianz. So stieß
man im literarischen Netz auf bis dahin unbekannte Schwierigkeiten.
"Man fragt sich natürlich immer, was in einem Wissensnetz
plausibel ist und strukturiert es diesen plausiblen Raum umfassend
möglichst restriktiv. In der Welt der Literatur ist jedoch
alles möglich und man kann die wenigsten Dinge tatsächlich
ausschließen", musste Klaus Reichenberger, Managing
Director Knowledge Engineering bei der intelligent views GmbH,
erkennen.
Ein
Beispiel ist die Epochenabgrenzung. Da diese nicht eindeutig ist,
ist eine Darstellung auf einer konkreten Zeitleiste nicht so einfach
möglich. "Die Frage war deshalb, ob man auf eine Konkretisierung
weitestgehend verzichten sollte zu Lasten der Recherchierbarkeit
und Auswertbarkeit. Wir haben uns dafür entschieden, deutlich
zu machen, ab welchem Zeitpunkt eine im Wissensnetz dargestellte
Information spekulativ ist", so Roland Spahr. Wissensnetze
externalisieren zu einem großen Teil auch persönliches
Wissen, dessen Subjektivität dann aber in einem vom Träger
losgelösten Wissensraum in einer Schein-Objektivität
aufgehoben wird. Dem Nutzer muss bewusst sein bzw. bewusst gemacht
werden, dass Inhalte und Relationen auf interpretatorischen Entscheidungen
beruhen. Doch selbst wenn Interpretationen als solche kenntlich
gemacht werden, muss ihre Notwendigkeit nach wie vor kritisch
hinterfragt werden. "Wir haben z.B. Relations-Typen wie ist
befreundet mit oder ist verfeindet mit auf die
neutrale Aussage steht in Kontakt mit reduziert."
Technisch
ist sicherlich Vieles möglich. Es ist eine inhaltliche Entscheidung,
was letztlich auch wünschenswert ist. Dazu müssen Definitionen
aufgestellt und Entscheidungen getroffen werden. "Bei der
Abstimmung von technisch Möglichem und inhaltlich Wünschenswertem
haben uns allen oft die Köpfe geraucht", erinnert sich
Klaus Reichenberger.

Vom Lektor zum Projektmanager
Mit
dem Thomas-Mann-Projekt betritt der S. Fischer Verlag Neuland.
Zur Realisierung sind Kompetenzen gefragt, über die der Verlag
und dessen Lektoren nicht alleine verfügen. Vielmehr ist
die intensive Kooperation mit verschiedenen Projektpartnern notwendig.
Am Thomas-Mann-Projekt sind beteiligt:
- S. Fischer Verlag, Frankfurt am Main, Mitarbeiter von Lektorat
und Herstellung
(Konzepterstellung, editorische Arbeit, Betreuung der Buchausgabe,
Aufbau des semantischen Netzes)
- VIA Informationsarchitekturen, Heidelberg
(Beratung, Konzepterstellung, Aufbau der Informationsarchitektur,
Kommunikationsschnittstelle zwischen Verlag und Softwarehersteller,
Konzeption des semantischen Netzes)
- intelligent views GmbH, Darmstadt
(Konzeption des semantischen Netzes, Werkzeuge zum semantischen
Netz und Entwicklung weiterer spezieller redaktioneller Tools,
Entwicklung der elektronischen Ausgabe)
- Pagina, Tübingen
(Satzarbeit)
- Clausen & Bosse, Leck
(Buchausgabe)
Doch
auch interne redaktionelle Arbeitsabläufe haben sich geändert.
So teilt sich die Redaktion in eine so genannte Aufbau-Redaktion,
die den Informationspool füllt und das Wissensnetz knüpft,
und eine Produkt-Redaktion, die dann Inhalte für die verschiedensten
Produkte selektiert und redigiert. Mit Hilfe des strukturierten
Informationspools wird die Produktion von Spin-Off-Produkten,
wie z.B. eines Taschenbuches zum Thema "Thomas Mann und Gerhart
Hauptmann", mit wenig Aufwand, schnell und kostengünstig
möglich sein. Technisch möglich ist hier sogar eine
Vorgabe der für das angestrebte Format verbindlichen Dokumentenstruktur,
die dann über den Informationspool bereits mit Archivtexten
gefüllt wird. Doch Roland Spahr schränkt ein: "Spin-Off-Produkte
auf Knopfdruck wird es nicht geben, denn auch das ausgefeilteste
Wissensnetz kann die Textkenntnis, das kritische Urteil eines
Lektors bei der Selektion und Aufbereitung relevanter Themen und
Texte nicht ersetzen. Das Wissensnetz wirkt unterstützend,
kann aber die eigentliche inhaltliche Arbeit nicht ersetzen."
Nichtsdestotrotz
ändert sich die Arbeit eines Lektors durch den Einsatz neuer
Technologien und den Umgang mit neuen Medien. Aspekte der Herstellung
kommen zur inhaltlichen Arbeit hinzu, technische Fragen im Hinblick
auf Textkonvertierung und semantische Auszeichnung verlangen nach
neuen Kompetenzen, die Grenzen zum Marketing werden aufgeweicht,
die Produktplatzierung ist plötzlich schon bei der Konzeption
im Lektorat ein Thema. Zur eigentlichen inhaltlichen Kompetenz
ein Gutteil der Belesenheit ist ja jetzt im Wissensnetz
externalisiert gesellen sich neue Kompetenzen. Fähigkeiten
entfalten sich an anderer Stelle, eine Entgrenzung des ursprünglich
in der Ausbildung erworbenen Wissens ist die Folge.
Leserbrief
schreiben

|