|
Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews
Digitaler Pressespiegel respektiert Copyright
Artikel erschienen
in
Ausgabe Februar 2002
Von Manfred
Hauer
Inhaltsübersicht:
In vielen Unternehmen werden für
die Presseschau urheberrechtlich geschützte Dokumente kopiert,
ohne die rechtlichen Folgen zu bedenken. Wer den Aufwand durch
Digitalisierung verringert, spart Personalkosten und somit Geld,
das dann korrekterweise an die VG Wort abgeführt werden kann.
Die elektronische Speicherung von Zeitungsartikeln verstößt
gegen das Urheberrecht und ist ohne Erlaubnis durch die Urheber
prinzipiell nicht gestattet. Nur sieben Fotokopien eines Artikels
sind legal. Wer mehr Kopien benötigt, konnte bisher über
erhebliche Abgaben an VG Wort sein Handeln legalisieren. Doch
die elektronische Speicherung blieb bisher ein Tabu.
Viele Unternehmen verstoßen gegen diese geltende Rechtslage.
Deshalb haben deutsche Verlagshäuser wie Frankfurter Allgemeine
Zeitung, Süddeutscher Verlag, Spiegel, Burda, Axel Springer
u.a. die Gesellschaft Presse-Monitor
(PMG) mit Sitz in Berlin gegründet. Die Gesellschaft verkauft
die Lizenzen zur elektronischen Nutzung. Seit April 2001 ist die
PMG aktiv rund 70 Titel aus Deutschland, Österreich
und der Schweiz sind bisher im Angebot; die regionalen Zeitungen
werden zügig folgen. Die allgemein wichtigsten Publikationen
aus Tages- und Wochenpresse sind verfügbar. Die PMG bietet
registrierten Kunden über das Internet den Zugang zum elektronischen
Text der Artikel. Man kann darin recherchieren, Profile zur Suche
einrichten und die gewünschten Artikel als XML-Datei lokal
vearbeiten. HTML und PDF werden auch angeboten, bieten aber weniger
Möglichkeiten zur lokalen Verarbeitung.
Bilder stehen nicht zur Verfügung, denn die Verlage haben
in der Regel selbst nicht das Recht am Bild. Tabellen sollen später
angeboten werden. Dies liegt nicht an der PMG, sondern an den
Satzsystemen der Verlagshäuser: Tabellen müssen nachträglich
aus den Druckdaten herausgeholt werden. Bei der PMG kommen in
der Regel die Daten so an, wie sie in den Satz geliefert wurden.
Das heißt, die Original-Satzdarstellung ist nicht verfügbar.
Dies liegt daran, dass im Satz nicht einzelne Artikel, sondern
jeweils ganze Seiten verarbeitet werden.

Scanning in der Firma ist teurer als Download
Wer wegen des Druckbilds weiterhin Scannen und die Artikel elektronisch
ausschneiden will, kann sich bei der PMG die Rechte auch dafür
kaufen. Jeder einzelne Artikel muss registriert werden. Unter
dem Strich ist aber das eigene Scanning deutlich teurer als der
Download. Wer weder für das Download noch für das Scanning
zahlt, kann bald zur Kasse gebeten werden. Das kann teuer werden:
Rund 200 Euro pro Tag kostet durchschnittlich die legale Variante,
wie die PMG vorrechnet. Angesichts dessen können schnell
Schadenssummen von rund 40.000 Euro pro Jahr entstehen. Somit
handelt es sich also weder um Bagatellen noch um Kavaliersdelikte.
Die Rechtslage in Österreich und in der Schweiz ist ähnlich.
Die Option, Nachrichten im XML-Format zu kaufen, bietet wesentliche
neue Möglichkeiten: Schon bei der Auswahl für die Presseschau
kann man sich die Rechercheeigenschaften auf dem Server der PMG
zunutze machen und die notwendige Zeit für Blättern
und Browsen durch gedruckte Publikationen zurückfahren. Doch
die Musik spielt dann zu Hause; die so übermittelten Daten
können in iNEWS der einzigen bisher unter Lotus Notes
& Domino verfügbaren Lösung auf eigenen Servern
gespeichert werden, mit dem Recht, diese Artikel der PMG vier
Wochen im Domino- oder Intranet zu präsentieren. Profile
für Einzelpersonen, Projektteams, Abteilungen oder Geschäftsbereiche
aufzusetzen, zuzusenden und auszudrucken, ist dann lokal möglich.
iNEWS 1.0, eine Entwicklung der AGI Information Management
Consultants, greift die von der PMG gezippten XML-Dateien auf
und spielt sie in die Datenbank ein. Dort werden die Daten intelligent
weiterverarbeitet. Die integrierte maschinelle Indexierungssoftware
IC CAI-Engine analysiert mit linguistischen und statistischen
Verfahren den gesamten Text. Als Resultat listet sie jeweils die
wichtigsten Deskriptoren Stichworte aus dem Text, Branchen,
Facetten sowie Personen und Organisationen auf. Das Ergebnis
dieser maschinellen Indexierung kann sich qualitativ durchaus
mit professionellen Dokumentaren messen, wie sie zum Beispiel
bei Pressearchiven arbeiten. Doch damit nicht genug: Eine Summary
mit den wichtigsten Sätzen aus dem Text rundet die Analyse
ab.
AGI Information Management Consultants haben sich für
die IC CAI-Engine und gegen den Lotus Discovery Server entschieden,
weil als Hardware bereits eine Workstation genügt, die die
gesamte Installation in einer Minute erledigt und das Indexierungsergebnis
zumindest im Deutschen besser ist.

Einfache Suche durch Indexierung
Diese Indexierung kann in der sehr ausgereiften Suchmaske genutzt
werden, um qualitativ anspruchsvolle Suchen zu formulieren oder
als Profil zu speichern. Wer beim Lesen auf einen interessanten
Beitrag stößt, kann mit einem speziellen Suchbutton
ohne die Eingabe von Deskriptoren ähnliche Artikel finden,
seien es thematisch stark verwandte Artikel aus anderen Publikationen
vom gleichen Tag oder Vorgänger dieses Themas. Solche Funktionen
sind zum Beispiel von der Internet-Suchmaschine Google
bekannt.
Auch hier fehlt wie bei Google nicht die maschinelle Übersetzung
von Fremdsprachen. Nicht alle Nachrichten, die in iNEWS einfließen,
kommen aus deutschsprachigen Quellen. Die Anwendung übernimmt
ebenso wie PMG-Daten auch die XML-Daten von Factiva,
einem gemeinsamen Unternehmen von Reuters und Dow Jones, den weltweit
größten Nachrichtenagenturen. Um die 7.000 Quellen
rund um den Globus werden dort angeboten. Aufgrund einer ausgefeilten
Indexierung, die dort maschinell und intellektuell vorgenommen
wird, können Fragen zielsicher formuliert werden. Factiva
sendet die Daten; bei PMG müssen diese derzeit noch selbst
geholt werden. Insofern macht es für Deutsche durchaus Sinn,
die Factiva-Daten zusätzlich übersetzt zu bekommen.
Ähnlich sehen dies wohl viele ausländische Mitarbeiter
deutscher Unternehmen, wenn ihnen die deutsche Tagespresse in
ihrer Muttersprache angeboten wird.
Dank Lotus Notes & Domino ist auch die Übernahme von
Web-Seiten oder die Volltext-Indexierung von Dateianhängen
kein Problem. Einige dieser Dateianhänge kommen zum Beispiel
aus dem Scanning und OCR. Dabei handelt es sich um eine Integration
von Adobe Acrobat Capture 3.0, in der Scanning und OCR wie eine
Notes-Funktion erscheinen. So generierte PDF-Dateien sehen aus
wie das Original, sind aber recherchierbare Texte. Auch für
Fachzeitschriften ist eine Lösung integriert, die mit der
internationalen Zeitschriftenagentur Swets
Blackwell zusammenarbeitet. Die Inhaltsverzeichnisse von derzeit
bis zu 18.000 Publikationen, teils mit einer URL auf den Original-Artikel,
können eingespielt werden.
Natürlich für Notes-Profis ist die Datenbank
eine Mail-In-Datenbank. Das heißt, neue Nachrichten, Pressemitteilungen,
interne Berichte, Vorstandsreden und andere sonst kaum verfügbare
Daten lassen sich einfach per E-Mail dahin schicken. Allerdings
wird so eine E-Mail erst nach der Freigabe durch den Administrator
allgemein verfügbar; Junk hat keine Chance.
Mit Cut & Paste lassen sich auch einzelne Seiten aus dem
Internet hereinholen bei Google nennt sich die vergleichbare
Funktion aus Benutzersicht "Im Archiv". Mit einer Option
in Adobe Acrobat können aber ganze Webseiten in eine einzige
PDF zusammengesammelt werden. Auch solche Daten sind technisch
möglich, wenn auch oft nicht erlaubt, denn auch im Web gilt
das Urheberrecht.
Bei soviel Content fehlt einem leicht die Zeit zum Lesen. Dank
der ausführlichen maschinellen Indexierung und der Volltext-Indexierung
in Domino kann jeder Leser aber seine Informationsmenge individuell
zuschneiden und drucken. Viele haben dazu trotz aller Technik
keine Lust. Selbstverständlich können diejenigen, die
schon heute die Presseschau zusammenstellen, die Auswahl treffen
und die Presseschau zusenden als Word, PDF oder gedruckt.
Der Multimedia-Mix bereitet beim Drucken in Version 1.0 noch einige
Probleme, die jeder vom Internet kennt: Unterschiedliche Datenformate
lassen sich nicht einfach als Gruppe ausdrucken. Das Release 2.0
im nächsten Jahr soll Abhilfe schaffen. Die Daten von PMG
und Factiva werden schon jetzt wie eine klassische Presseschau
dargeboten: mit Titelblatt, Einleitung, Inhaltsverzeichnis, den
Artikeln und mit Rückseite. Dahinter steht MS Word 2000,
mit dem ein attraktives Druckbild realisiert werden kann, gemäß
dem Corporate Design für diejenigen, die den Pressespiegel
doch auf Papier lesen möchten.

Budget für Copyright leicht verwalten
Die bisherige Praxis bei der Presseschau verursachte insbesondere
Personalkosten, aber kaum externe Kosten, da die Urheberrechte
meist sowieso missachtet werden. Wer aber seinen kopierten Pressespiegel
korrekt bei VG Wort bezahlt, benötigt ein anderes Budget.
iNEWS hat deshalb die Kostenstellenrechnung gleich mit implementiert,
um die Kosten entsprechend dem Aufwand an die jeweiligen Empfänger
gerecht weiterzubelasten. So lassen sich unternehmensintern durchaus
Profite realisieren. Die Software-Kosten mit 800 Euro pro Monat
sind angesichts von soviel Leistung eigentlich geschenkt. Optional
kann ein externer Server mit gemietet werden und wer will, wird
auch noch mit Content versorgt. Nur Lesen muss man selbst. Der
Button "Lies mir bitte vor" kommt vielleicht im nächsten
Jahr...
Leserbrief schreiben
|