|
Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews
Möglichkeiten und Grenzen der Informationssuche
im Internet
Artikel erschienen
in
Ausgabe Oktober 2001
Von Thorsten
Peske
Inhaltsübersicht:
Das 21. Jahrhundert ist das Zeitalter der
Information. Die spannende Frage ist nicht mehr, ob es die gesuchte
Information überhaupt gibt, sondern: "Wo und wie bekomme
ich die richtige Information?" Die Antwort hierauf ist oft
das Internet. Doch das Internet besteht aus mehreren Milliarden
Webseiten, die auf über 100 Millionen Host-Rechnern verteilt
sind.
Quantität und Qualität
Im Internet werden Informationen aus unterschiedlichsten Quellen,
wie z.B. Privatpersonen, Initiativen, Unternehmen, internationalen
Organisationen, aber auch extremistischen Gruppen, bereitgestellt
und erzeugt. Jeder kann ungeprüft Informationen einstellen;
keine übergeordnete Stelle erfasst, verwaltet und prüft
diese verteilten Informationen. Informationen sollten deshalb
stets in Relation zu ihrer Quelle gesehen werden, denn die Qualität
der Quelle ist ein besonders wichtiges Bewertungskriterium.
Laut einer Studie der kalifornischen Universität Berkeley
wird in den nächsten 2,5 Jahren die gleiche Informationsmenge
generiert werden wie in den letzten 300.000 Jahren Menschheitsgeschichte.
Diese Relation verdeutlicht den enormen Zuwachs an zum
größten Teil elektronisch gespeicherter und verfügbarer
Information. Um in der Fülle der Informationen fündig
zu werden, ist es notwendig, das zu Suchende anfangs klar beschreiben
und eingrenzen zu können. Hierfür bietet sich folgende
Vorgehensweise an:
- Problemstellung festlegen
- Suchproblem(e) konkretisieren
- Hauptproblem identifizieren
- weitere Probleme identifizieren
- Ziele der Suche definieren
- Kriterien der Suche ableiten
- Prioritäten bestimmen
- Suchmöglichkeiten auswählen
|

Möglichkeiten der Suche
Nach einer Studie von Berrier Associates aus dem Jahr 2000 verbringen
50% der befragten 1.000 Internet-Nutzer mehr als 70% ihrer Surfzeit
mit Suchen. Zudem gaben 44% der Befragten an, dass die Webnavigation
und die Benutzung von Suchmaschinen sie frustrierten. Dem Internet-Nutzer
steht jedoch eine Vielzahl von Möglichkeiten, die auf Pull-
oder Push-Technologien beruhen, zur Verfügung, um Ineffizienz
und Frustration zu vermeiden.
Portale
Lässt sich eine Information genau einem Bereich zuordnen,
so bilden Portale oder Informationsseiten von Organisationen oder
Verbänden einen guten Ausgangspunkt für die Suche, da
dort gebündelter Inhalt bereitsteht. Falls die Information
nicht vorhanden ist, so findet man dort meist sinnvoll strukturierte
Linklisten. Auch FAQs (Frequently Asked Questions) zu den jeweiligen
Themen können bereits viele Fragen beantworten.

Suchmaschinen
Fehlt ein solcher konkreter Ausgangspunkt, bietet es sich an,
eine Suchmaschine und deren Dienste in Anspruch zu nehmen. Um
die Leistungsmöglichkeiten der zahlreichen angebotenen Suchmaschinen
beurteilen zu können, ist es notwendig, sich deren prinzipielle
Vorgehensweise vor Augen zu halten.
Qualitätsmaßstab für Suchmaschinen sind die Algorithmen
zur Relevanzbestimmung, auf deren Basis letztendlich aus der Vielzahl
der bei einer Anfrage ermittelten Seiten die tatsächlich
relevanten Seiten identifiziert und dem Benutzer an oberster Stelle
präsentiert werden. Beruhte früher die Relevanzeinschätzung
von Suchergebnissen allein auf Worthäufigkeiten innerhalb
einer Internetseite, sorgen heute komplexe Verfahren für
verbesserte Ergebnisse. Suchmaschinen wie z.B. Google
sind aufgrund ihrer Page-Rank-Technologie besonders dafür
geeignet, so genannte Hubs im Internet zu finden. Diese stellen
Knotenpunkte dar, weil eine Vielzahl anderer Seiten auf sie verlinkt
sind. Bei diesem Popularitätsindex wird davon ausgegangen,
dass die Anzahl der verlinkten Seiten Rückschlüsse auf
die Qualität einer Seite zulässt.
Andere Suchmaschinen (z.B. AltaVista)
ermöglichen komplexe Boolesche Abfragen, d.h. die Verknüpfung
einer Vielzahl von Begriffen mit so genannten Booleschen Operatoren
(z.B. AND, OR, NEAR, Joker). Diese führen bei spezifischen
Anfragen schnell zum gewünschten Ziel.
Trotz der Vielzahl der zur Verfügung stehenden Suchmaschinen
erfassen diese jedoch maximal 20% aller Internetseiten. Außerdem
stellen lange Update-Zyklen bei der Indexpflege ein erhebliches
Problem bezüglich der Informationsaktualität dar. Hier
zeigt sich, dass der zentralistische Ansatz von Suchmaschinen
für die dezentrale Struktur des Internets eigentlich ungeeignet
ist.
Je nach gewünschter Information stellen Suchmaschinen eher
eine als durchschnittlich zu bewertende Lösung dar, da der
Zeitaufwand bis zur Identifikation der richtigen Information sehr
hoch sein kann. Nicht zuletzt bedarf es für einen effizienten
Einsatz von Suchmaschinen einer gewissen Einarbeitungszeit. Das
Fehlen eines iterativen Prozesses (Benutzerrückkopplung)
zur Ergebniseingrenzung bzw. -verbesserung erschwert eine sinnvolle
Suche. Oft führt auch die Kommerzialisierung (z.B. www.goto.com)
zu verfälschten Ergebnissen ("pay for relevance").

Kataloge
Kataloge, die oftmals von Suchmaschinen bereitgestellt werden,
bieten die Möglichkeit, themenspezifische Informationen schnell
zu finden. Aufgrund der notwendigen redaktionellen Arbeit zur
Erstellung von Katalogen ist deren Umfang jedoch begrenzt. Das
von rund 40.000 freiwilligen Redakteuren gepflegte "Open
Directory Project" (www.dmoz.org)
z.B. ist das weltweit größte Katalogprojekt und beinhaltet
ca. 400.000 Kategorien, aber lediglich 2,8 Millionen Internetseiten.

Meta-Suchmaschinen
Meta-Suchmaschinen fragen mehrere Suchmaschinen und/oder Webverzeichnisse
gleichzeitig ab. Für allgemeine Suchanfragen lassen sich
Meta-Suchmaschinen gut verwenden. Tiefergehende Recherchen führt
man aber besser in den abgefragten Quellen direkt durch, da Meta-Suchmaschinen
aus Kompatibilitätsgründen keine komplexen Abfragen
zulassen.

Fachsuchmaschinen
Weiterhin existieren noch Fach- und Spezialsuchmaschinen. Diese
bieten eine thematische Abgrenzung und sind oft auf entsprechenden
Portalen zu finden. Fachsuchmaschinen ermöglichen eine genauere
Eingrenzung der Suche als allgemeine Suchmaschinen.

Datenbanken
Eine weitere wichtige Informationsquelle im Internet stellen
Online-Datenbanken dar. Es existieren gegenwärtig für
nahezu jedes Wissensgebiet mehr oder weniger spezialisierte kostenlose
oder kostenpflichtige Datenbanken.
Datenbanken weisen meist strukturierte Daten auf, wodurch die
Suche auf definierte Felder eingeschränkt werden kann (z.B.
Titel, Autor, Datum, Umsatz etc.). Geübte Rechercheure finden
hier durch komplexe Abfragen schnell die gewünschte Information.
Viele Datenbanken ermöglichen zudem die Speicherung von Suchprofilen
und die Benachrichtigung des Benutzers bezüglich neuen, für
ihn relevanten Informationen. Northern Light (www.northernlight.com)
bietet diese Funktion als eine der wenigen Suchmaschinen ebenfalls
an.
Die Suche in Datenbanken erweist sich insbesondere bei einer
sehr konkreten Suche z.B. nach Artikeln, Bilanzen, Firmenprofilen,
Tabellen etc. als sinnvoll. Nachteilig für die Benutzung
von Datenbanken ist, dass deren uneinheitliche Benutzeroberfläche
und die oft fehlende Möglichkeit einer Cross-Recherche über
mehrere Datenbanken die Suche erschweren.

Suchagenten
Für Vielsucher bietet sich die Nutzung zusätzlicher
Recherchewerkzeuge in Form von Suchagenten an. Diese bieten gegenüber
reinen Suchmaschinen höheren Komfort bei der Verarbeitung
der Suchergebnisse: Suchagenten fragen mehrere webbasierte Suchdienste
parallel ab und bilden oft einen eigenen Index über das Suchergebnis
(z.B. www.lexibot.com).
Dies ermöglicht weitergehende Analysen der gefundenen Ergebnisse.
Die kompletten Ergebnislisten können abgespeichert oder per
E-Mail versandt werden. Die Inhalte sind vergleichbar und nach
eigenen Kriterien sortierbar. Einige Anwendungen erlauben neben
der Websuche zusätzlich die Suche auf dem PC bzw. dem lokalem
Netzwerk.
Ein weiterer Vorteil ist die Abfrage des unsichtbaren (invisible)
Web. Dies sind dynamisch generierte Websites, die von normalen
Suchmaschinen nicht erfasst werden. LexiBot schätzt die Größe
des unsichtbaren Web auf 550 Milliarden Webseiten. Das für
Suchmaschinen sichtbare Web wird von Cyveillance (www.cyveillance.com)
hingegen auf nur rund 3,4 Milliarden Webseiten geschätzt.
Der Einsatz von Suchagenten lohnt sich vor allem bei häufigen
und umfangreichen Recherchen, welche die notwendige Einarbeitungszeit
rechtfertigen. Zusammenfassend lässt sich sagen, dass Suchagenten
eine weitestgehende Personalisierung der Suche ermöglichen.

Newsletter & Co.
Newsletter und Mailinglisten eignen sich vor allem für die
kontinuierliche Versorgung mit fachspezifischen Informationen,
weil diese dem Nutzer regelmäßig direkt zugestellt
werden. Auch Diskussionsforen, zu deren regelmäßigen
Nutzern oftmals Experten gehören, bieten bei Fragen und Problemstellungen
eine sehr gute Anlaufstelle. Zur Suche nach einer aktuell benötigten
und konkreten Information sind diese Quellen allerdings kaum geeignet.

Suchen und suchen lassen
In der Zukunft wird das Internet Informationen in neuer Form
bereitstellen können: Neue Standards wie beispielsweise XML
(Extended Markup Language) ermöglichen eine bessere Strukturierung
der Informationen. Höhere Übertragungsraten und verbesserte
Technologien werden die Suche in multimedialen Informationspools
ermöglichen. Es ist jedoch nicht davon auszugehen, dass sich
bezüglich der Struktur des Internets und damit seiner Übersichtlichkeit
etwas Wesentliches ändert.
Die Tatsache, dass die Suche nach Informationen für normale
Anwender zeit- und kostenintensiv ist und bleiben wird, hat dazu
geführt, dass gerade unter Zeitdruck stehende Manager mit
hohen Ansprüchen an die Informationsqualität auf externe
Recherchespezialisten zurückgreifen. Diese bieten von einfachen
Informationen bis hin zur Analyse komplexer Fragestellungen ein
breites Dienstleistungsangebot rund um Informationen und Wissen
an.

Leserbrief
schreiben
|