Fachbücher

 
  Programm
Appetithappen
Bestellung

 

doculine Archiv

  Übersicht
Index
Autoren
Streifzüge

 
 

Service

 
  transline tecNews
Suche
Impressum
 

Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews

Möglichkeiten und Grenzen der Informationssuche im Internet

 

Artikel erschienen in
Ausgabe Oktober 2001

Von Thorsten Peske

Inhaltsübersicht:

Das 21. Jahrhundert ist das Zeitalter der Information. Die spannende Frage ist nicht mehr, ob es die gesuchte Information überhaupt gibt, sondern: "Wo und wie bekomme ich die richtige Information?" Die Antwort hierauf ist oft das Internet. Doch das Internet besteht aus mehreren Milliarden Webseiten, die auf über 100 Millionen Host-Rechnern verteilt sind.


Quantität und Qualität

Im Internet werden Informationen aus unterschiedlichsten Quellen, wie z.B. Privatpersonen, Initiativen, Unternehmen, internationalen Organisationen, aber auch extremistischen Gruppen, bereitgestellt und erzeugt. Jeder kann ungeprüft Informationen einstellen; keine übergeordnete Stelle erfasst, verwaltet und prüft diese verteilten Informationen. Informationen sollten deshalb stets in Relation zu ihrer Quelle gesehen werden, denn die Qualität der Quelle ist ein besonders wichtiges Bewertungskriterium.

Laut einer Studie der kalifornischen Universität Berkeley wird in den nächsten 2,5 Jahren die gleiche Informationsmenge generiert werden wie in den letzten 300.000 Jahren Menschheitsgeschichte. Diese Relation verdeutlicht den enormen Zuwachs an – zum größten Teil elektronisch gespeicherter und verfügbarer – Information. Um in der Fülle der Informationen fündig zu werden, ist es notwendig, das zu Suchende anfangs klar beschreiben und eingrenzen zu können. Hierfür bietet sich folgende Vorgehensweise an:

  1. Problemstellung festlegen
  2. Suchproblem(e) konkretisieren
  3. Hauptproblem identifizieren
  4. weitere Probleme identifizieren
  5. Ziele der Suche definieren
  6. Kriterien der Suche ableiten
  7. Prioritäten bestimmen
  8. Suchmöglichkeiten auswählen


Möglichkeiten der Suche

Nach einer Studie von Berrier Associates aus dem Jahr 2000 verbringen 50% der befragten 1.000 Internet-Nutzer mehr als 70% ihrer Surfzeit mit Suchen. Zudem gaben 44% der Befragten an, dass die Webnavigation und die Benutzung von Suchmaschinen sie frustrierten. Dem Internet-Nutzer steht jedoch eine Vielzahl von Möglichkeiten, die auf Pull- oder Push-Technologien beruhen, zur Verfügung, um Ineffizienz und Frustration zu vermeiden.


Portale

Lässt sich eine Information genau einem Bereich zuordnen, so bilden Portale oder Informationsseiten von Organisationen oder Verbänden einen guten Ausgangspunkt für die Suche, da dort gebündelter Inhalt bereitsteht. Falls die Information nicht vorhanden ist, so findet man dort meist sinnvoll strukturierte Linklisten. Auch FAQs (Frequently Asked Questions) zu den jeweiligen Themen können bereits viele Fragen beantworten.


Suchmaschinen

Fehlt ein solcher konkreter Ausgangspunkt, bietet es sich an, eine Suchmaschine und deren Dienste in Anspruch zu nehmen. Um die Leistungsmöglichkeiten der zahlreichen angebotenen Suchmaschinen beurteilen zu können, ist es notwendig, sich deren prinzipielle Vorgehensweise vor Augen zu halten.

Qualitätsmaßstab für Suchmaschinen sind die Algorithmen zur Relevanzbestimmung, auf deren Basis letztendlich aus der Vielzahl der bei einer Anfrage ermittelten Seiten die tatsächlich relevanten Seiten identifiziert und dem Benutzer an oberster Stelle präsentiert werden. Beruhte früher die Relevanzeinschätzung von Suchergebnissen allein auf Worthäufigkeiten innerhalb einer Internetseite, sorgen heute komplexe Verfahren für verbesserte Ergebnisse. Suchmaschinen wie z.B. Google sind aufgrund ihrer Page-Rank-Technologie besonders dafür geeignet, so genannte Hubs im Internet zu finden. Diese stellen Knotenpunkte dar, weil eine Vielzahl anderer Seiten auf sie verlinkt sind. Bei diesem Popularitätsindex wird davon ausgegangen, dass die Anzahl der verlinkten Seiten Rückschlüsse auf die Qualität einer Seite zulässt.

Andere Suchmaschinen (z.B. AltaVista) ermöglichen komplexe Boolesche Abfragen, d.h. die Verknüpfung einer Vielzahl von Begriffen mit so genannten Booleschen Operatoren (z.B. AND, OR, NEAR, Joker). Diese führen bei spezifischen Anfragen schnell zum gewünschten Ziel.

Trotz der Vielzahl der zur Verfügung stehenden Suchmaschinen erfassen diese jedoch maximal 20% aller Internetseiten. Außerdem stellen lange Update-Zyklen bei der Indexpflege ein erhebliches Problem bezüglich der Informationsaktualität dar. Hier zeigt sich, dass der zentralistische Ansatz von Suchmaschinen für die dezentrale Struktur des Internets eigentlich ungeeignet ist.

Je nach gewünschter Information stellen Suchmaschinen eher eine als durchschnittlich zu bewertende Lösung dar, da der Zeitaufwand bis zur Identifikation der richtigen Information sehr hoch sein kann. Nicht zuletzt bedarf es für einen effizienten Einsatz von Suchmaschinen einer gewissen Einarbeitungszeit. Das Fehlen eines iterativen Prozesses (Benutzerrückkopplung) zur Ergebniseingrenzung bzw. -verbesserung erschwert eine sinnvolle Suche. Oft führt auch die Kommerzialisierung (z.B. www.goto.com) zu verfälschten Ergebnissen ("pay for relevance").


Kataloge

Kataloge, die oftmals von Suchmaschinen bereitgestellt werden, bieten die Möglichkeit, themenspezifische Informationen schnell zu finden. Aufgrund der notwendigen redaktionellen Arbeit zur Erstellung von Katalogen ist deren Umfang jedoch begrenzt. Das von rund 40.000 freiwilligen Redakteuren gepflegte "Open Directory Project" (www.dmoz.org) z.B. ist das weltweit größte Katalogprojekt und beinhaltet ca. 400.000 Kategorien, aber lediglich 2,8 Millionen Internetseiten.


Meta-Suchmaschinen

Meta-Suchmaschinen fragen mehrere Suchmaschinen und/oder Webverzeichnisse gleichzeitig ab. Für allgemeine Suchanfragen lassen sich Meta-Suchmaschinen gut verwenden. Tiefergehende Recherchen führt man aber besser in den abgefragten Quellen direkt durch, da Meta-Suchmaschinen aus Kompatibilitätsgründen keine komplexen Abfragen zulassen.


Fachsuchmaschinen

Weiterhin existieren noch Fach- und Spezialsuchmaschinen. Diese bieten eine thematische Abgrenzung und sind oft auf entsprechenden Portalen zu finden. Fachsuchmaschinen ermöglichen eine genauere Eingrenzung der Suche als allgemeine Suchmaschinen.


Datenbanken

Eine weitere wichtige Informationsquelle im Internet stellen Online-Datenbanken dar. Es existieren gegenwärtig für nahezu jedes Wissensgebiet mehr oder weniger spezialisierte kostenlose oder kostenpflichtige Datenbanken.

Datenbanken weisen meist strukturierte Daten auf, wodurch die Suche auf definierte Felder eingeschränkt werden kann (z.B. Titel, Autor, Datum, Umsatz etc.). Geübte Rechercheure finden hier durch komplexe Abfragen schnell die gewünschte Information. Viele Datenbanken ermöglichen zudem die Speicherung von Suchprofilen und die Benachrichtigung des Benutzers bezüglich neuen, für ihn relevanten Informationen. Northern Light (www.northernlight.com) bietet diese Funktion als eine der wenigen Suchmaschinen ebenfalls an.

Die Suche in Datenbanken erweist sich insbesondere bei einer sehr konkreten Suche z.B. nach Artikeln, Bilanzen, Firmenprofilen, Tabellen etc. als sinnvoll. Nachteilig für die Benutzung von Datenbanken ist, dass deren uneinheitliche Benutzeroberfläche und die oft fehlende Möglichkeit einer Cross-Recherche über mehrere Datenbanken die Suche erschweren.


Suchagenten

Für Vielsucher bietet sich die Nutzung zusätzlicher Recherchewerkzeuge in Form von Suchagenten an. Diese bieten gegenüber reinen Suchmaschinen höheren Komfort bei der Verarbeitung der Suchergebnisse: Suchagenten fragen mehrere webbasierte Suchdienste parallel ab und bilden oft einen eigenen Index über das Suchergebnis (z.B. www.lexibot.com). Dies ermöglicht weitergehende Analysen der gefundenen Ergebnisse. Die kompletten Ergebnislisten können abgespeichert oder per E-Mail versandt werden. Die Inhalte sind vergleichbar und nach eigenen Kriterien sortierbar. Einige Anwendungen erlauben neben der Websuche zusätzlich die Suche auf dem PC bzw. dem lokalem Netzwerk.

Ein weiterer Vorteil ist die Abfrage des unsichtbaren (invisible) Web. Dies sind dynamisch generierte Websites, die von normalen Suchmaschinen nicht erfasst werden. LexiBot schätzt die Größe des unsichtbaren Web auf 550 Milliarden Webseiten. Das für Suchmaschinen sichtbare Web wird von Cyveillance (www.cyveillance.com) hingegen auf nur rund 3,4 Milliarden Webseiten geschätzt.

Der Einsatz von Suchagenten lohnt sich vor allem bei häufigen und umfangreichen Recherchen, welche die notwendige Einarbeitungszeit rechtfertigen. Zusammenfassend lässt sich sagen, dass Suchagenten eine weitestgehende Personalisierung der Suche ermöglichen.


Newsletter & Co.

Newsletter und Mailinglisten eignen sich vor allem für die kontinuierliche Versorgung mit fachspezifischen Informationen, weil diese dem Nutzer regelmäßig direkt zugestellt werden. Auch Diskussionsforen, zu deren regelmäßigen Nutzern oftmals Experten gehören, bieten bei Fragen und Problemstellungen eine sehr gute Anlaufstelle. Zur Suche nach einer aktuell benötigten und konkreten Information sind diese Quellen allerdings kaum geeignet.


Suchen und suchen lassen

In der Zukunft wird das Internet Informationen in neuer Form bereitstellen können: Neue Standards wie beispielsweise XML (Extended Markup Language) ermöglichen eine bessere Strukturierung der Informationen. Höhere Übertragungsraten und verbesserte Technologien werden die Suche in multimedialen Informationspools ermöglichen. Es ist jedoch nicht davon auszugehen, dass sich bezüglich der Struktur des Internets und damit seiner Übersichtlichkeit etwas Wesentliches ändert.

Die Tatsache, dass die Suche nach Informationen für normale Anwender zeit- und kostenintensiv ist und bleiben wird, hat dazu geführt, dass gerade unter Zeitdruck stehende Manager mit hohen Ansprüchen an die Informationsqualität auf externe Recherchespezialisten zurückgreifen. Diese bieten von einfachen Informationen bis hin zur Analyse komplexer Fragestellungen ein breites Dienstleistungsangebot rund um Informationen und Wissen an.


Leserbrief schreiben

  Doculine durchsuchen:   

  

Empfehlenswerte Seiten zur technischen Übersetzung
von transline - Übersetzungsdienst für technische Übersetzung
technische Übersetzungen | Übersetzung Software | Software Lokalisierung
Spez. Seiten zu Sprachen
Chinesisch Übersetzung | Englisch Übersetzung | Französisch Übersetzung | Niederländisch Übersetzung | Russisch Übersetzung | Spanisch Übersetzung | Portugiesisch Übersetzung | Italienisch Übersetzung | Japanisch Übersetzung
Infos zum Übersetzungsservice transline

Übersetzungen Ihrer Patente - Dr. Sturz Patentübersetzungen

Letzte Änderung: Monday, 31-Oct-2005 17:27:58 CET | Presse-Service | Disclaimer
© doculine Verlags-GmbH, ein Unternehmen der transline Gruppe