|
Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews
Information
und Wissen (Teil 2): Datenmanagement
Artikel
erschienen in
Ausgabe April 1999
Von
Annelyse Forst
Inhaltsübersicht:
In den
meisten Unternehmen stehen umfangreiche Datenbestände zur
Verfügung. Der Nutzen, den ein Unternehmen daraus ziehen
kann, ist aber oft gering, weil die vorhandenen Daten viel zu
selten den Bedürfnissen entsprechend analysiert und ausgewertet
werden: Nach einer Untersuchung von IBM geschieht dies mit lediglich
7% der Daten [1]. Daten
als Wirtschaftsgut, als wesentlichen Wettbewerbs-
und Produktionsfaktor zu nutzen, setzt jedoch voraus, dem
Datenmanagement eine eigenständige Unternehmensfunktion zuzuordnen,
eine eigenständige Managementstrategie zur Verbesserung der
Informationsversorgung im Unternehmen zu entwickeln sowie akkurate
und umfangreiche Auswertungswerkzeuge im Unternehmen einzuführen.
Dabei ist das Datenmanagement in der Regel Bestandteil eines umfassenden
Informationsmanagements, welches in Teil 3 dieser Beitragsreihe
behandelt werden soll.
Aufgaben des Datenmanagements
Unter
Datenmanagement versteht man einerseits alle Prozesse, die
der Planung, Beschaffung, Verwaltung und Nutzung der Unternehmensressource
Daten dienen, und andererseits die Organisationseinheiten, die
für diese Prozesse gesamthaft verantwortlich sind.
[2]
Die
Hauptaufgabe des Datenmanagements besteht darin, auf der Grundlage
der Datenarchitektur alle im Unternehmen verwendeten Daten
(Dateien und Datenbanken) zu planen, zu überwachen und zu
steuern, und zwar so, daß die zur Informationsversorgung
aller Aufgabenträger erforderlichen Daten verfügbar
sind [3]. In diesem
Zusammenhang soll das Datenmanagement auch das nötige Datenbewußtsein
im Unternehmen schaffen. Aus dieser Hauptaufgabe lassen sich folgende
Teilaufgaben ableiten:
- Modellierung
der Daten, um eine gemeinsame Datenarchitektur abzuleiten
- Auswahl
und Pflege der Datenbanktechnologie, der Datenbankarchitektur
und des Datenbankmanagement-Systems
- Daten-Reengineering,
um die Datenversorgung zu optimieren
Hinzu
kommen Aufgaben, die sich aus dem Data-Warehousing ableiten, einem
Konzept, das sich seit Mitte der Achtziger Jahre ausgebildet hat.
Ein Data-Warehouse dient dazu, die Entscheider in Unternehmen
mit den Informationen zu versorgen, die sie für ihre Führungs-
und Steuerungsaufgaben benötigen.
Voraussetzung: Datenqualität
Um
all diese Aufgaben erfüllen zu können, muß sich
das Datenmanagement zunächst mit der Datenqualität beschäftigen.
Qualitativ hochwertige Daten sind die Voraussetzung dafür,
daß sich unternehmensweit nutzbares Wissen ausbilden kann.
Die vorhandenen Daten müssen daher die folgenden Gütekriterien
erfüllen:
- Datenrichtigkeit:
Die Daten bilden die Realität so ab, wie sie ist.
- Datenvollständigkeit:
Die Daten bilden die Realität so vollständig ab, wie
Aufgabendurchführung bzw. Wirtschaftlichkeit es erfordern.
- Datenaktualität:
Die Daten müssen den Veränderungen der Realität
möglichst schnell und wirtschaftlich folgen.
- Aufgabenadäquanz:
Die Daten müssen den Anforderungen der betrieblichen Aufgaben
entsprechen.
- Datenkonsistenz:
Die geführten, abgeleiteten und verdichteten Daten dürfen
keine Widersprüche aufweisen. [3]
Es
gibt zur Zeit zwei Ansätze für die Gestaltung von Datenqualitätsprozessen,
die häufig miteinander kombiniert werden:
- Anwendung
(und Anpassung) der Normenreihe DIN ISO 9000 ff. für die
Datenqualitätsprozesse
- Umgestaltung
des Total Quality Managements in ein Total Data Quality Management
Im
Rahmen dieses Datenqualitätsmanagements ist das Identifizieren
der besonders wichtigen und kritischen Daten des Unternehmens
unentbehrlich.
Datenmodellierung
Eines
der Ziele des Datenmanagements ist die Integration der wesentlichen
Daten eines Unternehmens. Eine Möglichkeit, Daten zu integrieren,
besteht darin, die gemeinsamen Datenbestände in zentralen
und/oder verteilten Datenbanken zu speichern. Dies setzt voraus,
daß die Datenbestände analysiert bzw. modelliert wurden
und daraus eine gemeinsame Datenarchitektur abgeleitet wurde.
Der
Ablauf der Datenmodellierung gestaltet sich wie in Abbildung 1
anhand eines einfachen Beispiels dargestellt:
 |
|
Abb.
1: Datenmodellierung: von der Realwelt zur Datenaufzeichnung
|
In
der Alltagssprache bedeutet Modell die physische Verkleinerung
von Objekten wie z.B. Häusern oder Maschinen. Modelle in
der Datenmodellierung bilden dagegen nicht die gesamte Wirklichkeit
ab, sondern nur die wesentlichen Eigenschaften.
Ein
konzeptionelles Datenmodell leistet eine strukturierte Abbildung
der realen Welt des Unternehmens durch Reduzierung der Komplexität
auf einen relevanten Ausschnitt, nämlich auf Objekte und
deren Beziehungen.
Die Methoden der Datenmodellierung basieren hauptsächlich
auf dem 1976 von Chen entwickelten Entity-Relationship-Modell
(ERM). Innerhalb des ERM wird zwischen Entities (den einzelnen
realen oder abstrakten Objekten, die z.B. für einen Geschäftsprozeß
relevant sind) und Beziehungen (den logischen Zuordnungen zwischen
den Objekten) unterschieden.
Die
unternehmensweite Nutzung gemeinsamer Datenbestände durch
unterschiedliche Abteilungen setzt Datenmodelle auf Unternehmensebene
voraus. Man unterscheidet zwischen:
- Unternehmensdatenmodell:
Beschreibt die wesentlichen Daten eines Unternehmens auf einem
sehr hohen Abstraktionsniveau und enthält in der Regel
5 bis 15 Datenklassen.
- unternehmensweites
Datenmodell: Gibt einen umfassenden Überblick über
alle relevanten Objekte des Unternehmens und deren Beziehungen
zueinander; unternehmensweite Datenmodelle enthalten oft über
1.000 Datenklassen.
Zur
Datenmodellierung gehört zudem das Metadatenmanagement. Metadaten
enthalten alle Definitionen und Beschreibungen über
die Daten, Prozesse und technischen Strukturen sowie die SW-Systeme
des Unternehmens [2].
Sie werden in sogenannten Data Dictionaries bzw. in einem Repository
abgelegt. Während ein Data Dictionary nur die Metadaten selbst
enthält, umfaßt ein Repository zusätzlich die
logischen Datenmodelle und definiert die Daten gemäß
ihrer Bedeutung für das Unternehmen.
Die
Ziele des Metadatenmanagements sind:
- Standardisierung,
Definition und Beschreibung der Objekte der DV-Systeme
- Verfügbarkeit
dieser Informationen für alle Mitarbeiter, die sie benötigen
- Verfügbarkeit
dieser Informationen während der gesamten Lebenszyklen
der Objekte [2]
Der letztgenannte
Punkt ist besonders wichtig, da Daten häufig eine längere
Lebensdauer haben als andere DV-Komponenten.
Datenbankmanagement
Zu
den Anfängen der Datenverarbeitung gab es noch keine Datenbanken:
Die Verwaltung der Daten bzw. der Zugriff darauf wurde mit in
die Programme integriert. Dies führte zu einer Reihe von
Problemen, u.a. zu Datenredundanz, weil viele Programme die gleichen
Daten verarbeiteten. Daher fehlte oft die nötige Datenkonsistenz,
und jede Änderung der Daten führte zu einer Änderung
des Programmes. Um dieses Manko zu beheben, werden in Datenbanken
die Daten getrennt von den Programmen gespeichert, die sie verarbeiten.
Voraussetzung
für die Entwicklung von Datenbanken war neben technologischen
Fortschritten im Hard- und Softwarebereich insbesondere die Datenmodellierung,
denn die Datenmodelle liefern den Input für die Gestaltung
von Datenbanksystemen.
Datenbanken
bieten vielfältige Vorteile:
- minimale
(und geplante) Datenredundanz
- kurze
Zugriffszeiten
- hohe Datenintegrität
(z.B. durch gleiche Änderungsstände bei mehrfach gespeicherten
Daten) und hohe Datensicherheit
- Fähigkeit
zu Mehrnutzenbetrieb
- Datenflexibilität
für heutige und zukünftige Daten
- Wirtschaftlichkeit
- langfristige
Nutzbarkeit der Daten und Datenstrukturen [5]
Besonders
attraktiv sind die Möglichkeiten einer Wissensbank, in der
das Unternehmenswissen gebündelt angeboten wird. Anders als
bei herkömmlichen Datenbanken spielt hier die Informationsaufbereitung
eine sehr große Rolle und muß noch höheren Qualitätsstandards
genügen.
In
den meisten Unternehmen ist ein heterogenes Datenbankumfeld vorhanden,
das neben hierarchischen auch verteilte Datenbanken enthält.
Verteilte Datenbanken speichern die zusammengehörenden Daten
in physisch verschiedenen Rechnern, die miteinander vernetzt sind.
Daraus ergibt sich zusätzlich die Aufgabe, die Datenmigration
bzw. -koexistenz zu steuern, d.h. einen koordinierten Übergang
von einem System in ein anderes zu schaffen. (Mit der Datenmigration
findet häufig gleichzeitig auch eine Programm-Migration statt.)
Je
mehr Daten in Datenbanken gespeichert werden, desto wichtiger
sind die Fragen zu Datenschutz und -sicherheit, für die das
Datenmanagement ebenfalls verantwortlich ist. Es gilt, die Daten
ausreichend vor Verlust, Zerstörung, Fälschung oder
unberechtigten Zugriffen zu schützen.
Daten-Reengineering
Versteht
man unter Engineering das ingenieurmäßige Konstruieren
(z.B. von technischen Objekten oder Organisationsstrukturen),
bedeutet Reengineering folgerichtig die Neu-Konstruktion (z.B.
von existierenden Strukturen). Daten-Reengineering umfaßt
alle Methoden für die Entwicklung von integrierten Daten-
und Informationsbeständen.
Das
Ziel des Daten-Reengineerings besteht darin, durch ständige
Datenanalyse eine optimale Datenversorgung des Unternehmens zu
gewährleisten, also sowohl die Über- als auch Unterversorgung
mit Daten zu verhindern. Dies bedeutet:
- Nicht
mehr benötigte Daten müssen aus dem DV-System entfernt
werden. (Eine Untersuchung bei einer Bank hat beispielsweise
gezeigt, daß nur 10.000 von 100.000 gespeicherten Datenobjekten
zur Informationsversorgung nötig waren [3].)
- Zusätzlich
benötigte Daten müssen neu in das DV-System aufgenommen
werden.
Diese
Aufgaben unterstützen CASE-Tools wie etwa Composer von Texas
Instruments oder ADW von Knowlegdeware.
Data-Warehousing
Ein
Data-Warehouse-System besteht aus Transformationsprogrammen und
einem sogenannten Informationslager (Warehouse = engl. für
Lager), das von den operativen DV-Systemen und Datenbanken
isoliert ist. In diesem Informationslager sind zeitraumbezogene,
nicht mehr veränderbare Daten nach Sachzusammenhängen
geordnet. Ständig kommen neue Daten hinzu, die aus den unterschiedlichen
internen und externen Datenquellen des Unternehmens stammen. Mit
Hilfe der Transformationsprogramme werden die Daten, Datenstrukturen
und Datenformate so vereinheitlicht, daß sie ins Informationslager
aufgenommen werden können.
 |
|
Abb.
2: Komponenten eines Data-Warehouse-Systems
|
Die
derart transformierten Daten des Data-Warehouse lassen sich in
folgende Datenarten unterscheiden:
- Real
Time Data: Entsprechen den Daten aus den operativen Systemen.
- Reconciled
Data: Bereinigte Real Time Data, d.h. Inkonsistenzen und Redundanzen
wurden herausgenommen.
- Derived
Data: Ergebnisse aus dem Summieren, Verdichten etc.
- Changed
Data: Dokumentieren alle Änderungen, die die ursprünglichen
Daten erfahren haben, beschreiben also die Daten-Historie.
Hinzu
kommen wie in jeder Datenbank die Metadaten.
Einer
Befragung der META Group zufolge halten 90% der IT-Verantwortlichen
das Data-Warehousing für das geeignete Konzept, um sich in
zukünfigen Märkten kompetent zu behaupten [6].
Viele Unternehmen setzen bereits solche Konzepte ein: 1996 arbeiteten
15% der Unternehmen mit einem Data-Warehouse, 41% waren kurz vor
der Einführung, 32% planten die Implementierung in den nächsten
6 Monaten und 8% in den nächsten 12 Monate; nur 4% hatten
keine Pläne für Data-Warehousing [1].
Data-Warehousing
erhöht laut Schwinn u.a. [2]
das mehrdimensionale, strategische Denken und somit
die Lösungskompetenz der Mitarbeiter auf allen
Unternehmensebenen. Es wird vor allem in den Bereichen eingesetzt,
in denen man mit den Kunden arbeitet; mögliche Einsatzgebiete
sind daher insbesondere: Zielgruppenmarketing, Kunden-Info-Systeme,
Vertrieb und Controlling [6].
Auf
Basis des Data-Warehousing haben sich fünf Varianten von
Datenmanagement-Systemen entwickelt, die sich in ihrer Komplexität
unterscheiden:
- Reporting-Systeme:
Erzeugen Standardberichte mit Hilfe von Dokumentenabfragesprachen
wie z.B. SQL.
- Management-Informationssysteme
(MIS): Diese Datenmanagement-Systeme sind flexibler als Reporting-Systeme.
In einem MIS kann man z.B. Hypothesen entwickeln und überprüfen
sowie Daten unter verschiedenen Blickwinkeln untersuchen. Darüber
hinaus bieten MIS Aufbereitungsmöglichkeiten, um die Ergebnisse
benutzergerecht zu visualisieren. In der Regel wenden sich MIS
an eine bestimmte Zielgruppe mit einem ähnlichen Informationsbedürfnis,
welches mit vordefinierten Auswertungen befriedigt werden soll.
MIS sind in den Siebziger Jahren entstanden; seit den Achtzigern
werden sie als Führungs-Informationssysteme (FIS) oder
Executive-Informationssysteme (EIS) angeboten.
- Decision-Support-Systeme:
Erweitern die Management-Informationssysteme um analytische
Komponenten und unterstützen Entscheidungsfindungen auch
in Bereichen mit schlecht strukturierten Daten.
- Data-Mining:
Bei dieser Schatzsuche wird das Data-Warehouse mit
Hilfe von statistischen Analysen und Methoden der künstlichen
Intelligenz nach verborgenen oder schlummernden Zusammenhängen
und Mustern durchforstet. Die wichtigsten eingesetzten Methoden
sind Abhängigkeits-, Cluster- und Abweichungsanalysen,
Prognoseverfahren, Segmentierung und neuronale Netzwerke. Typische
Anwendungen sind Vorhersagemodelle und die Aufdeckung bisher
unbekannter Beziehungen. Die daraus gewonnenen Ergebnisse kann
das Unternehmen nutzen, um neue Produkte oder Dienstleistungen
zu entwickeln.
- Business-Support-Systeme:
Sind das Verbindungsglied zwischen den vier genannten Systemen
und den operativen DV-Systemen; sie transformieren die gewonnenen
Ergebnisse so, daß sie in den operativen Systemen verarbeitet
werden können.
[7]
 |
|
Abb.
3: Steigende
Komplexität erfordert intensiveren Methodeneinsatz
bei Datenmanagement-Systemen. (Quelle: [7])
|
Ausblick: Trends im Datenmanagement
Neue
Entwicklungen erfordern neue Konzepte; nach Schwinn u.a. [2]
sind derzeit die folgenden Trends im Datenmanagement zu beobachten:
- integriertes,
prozeßorientiertes Datenmanagement:
Die EDV-Abteilung gilt nicht mehr als allein verantwortlich
für die Daten; vielmehr werden die Datenprozesse im gesamten
Unternehmen als ein wichtiger Beitrag zum Wertschöpfungsprozeß
angesehen.
- Standardisierung:
Standardisierte Software ersetzt zunehmend Individuallösungen.
- Closed
Loop:
Die Ergebnisse und Erkenntnisse aus Datenmodellierung und Data-Warehousing
werden beim Data-Reengineering verwendet, um in die operativen
Datensysteme zurückzuwirken; so ergibt sich ein geschlossener
Datenkreislauf.
- verteiltes
Datenmanagement:
Ein zentral aufgebautes Datenmanagement ist bei weltweit tätigen
Unternehmen nicht flexibel genug, um die Informationsbedürfnisse
der einzelnen Unternehmensbereiche und Filialen zu befriedigen;
eine dezentrale Organisation des Datenmanagements ist hier vorteilhafter.
- lernende
Organisation mit Gedächtnis:
Eine lernende Organisation bezeichnet ein flexibles Unternehmen,
das im harten internationalen Wettbewerb besonders erfolgreich
ist. Diese Unternehmen verstehen sich als lebende Organismen,
bestehend aus motivierten und lernfähigen Mitarbeitern,
die gemeinsam an Zielen, Prozessen etc. arbeiten [8].
Eine solche lernende Organisation benötigt auch ein Gedächtnis,
welches das Wissen und die Erfahrungen der Organisation
als Ganzes speichert und effizient verfügbar macht
[2]. Dieser Trend gilt
besonders für wissensbasierte Unternehmen, die wissensintensive
Produkte oder Dienstleistungen anbieten.
- Wissensmanagement:
Datenmanagement wird zunehmend in ein umfassendes Wissensmanagement
eingebunden. Dieses relativ neue Managementkonzept verfolgt
das Ziel, Unternehmens- oder Organisationswissen zu identifizieren,
zu entwickeln, aufzubewahren und auf allen Ebenen bzw. in allen
Abteilungen zu verteilen, damit es allen Mitarbeitern zur Erfüllung
ihrer Aufgaben zur Verfügung steht. (Mit dem Konzept des
Wissensmanagements wird sich Teil 4 dieser Beitragsreihe beschäftigen.)
Literaturhinweise und Quellennachweise
[1]
Boehrer, D.: Data Warehouse und Data Mining. Bern 1997 (Haupt
Verlag).
[2]
Schwinn, K./R. Dippolt/A. Ringenberg/W. Schnider: Unternehmensweites
Datenmanagement. Von der Datenbankadministration bis zum modernen
Informationsmangement. München 1998 (Vieweg Verlag).
[3]
Heinrich, L.: Informationsmanagement. München 1996 (Oldenbourg
Verlag).
[5]
Schwarze, J.: Einführung in die Wirtschaftsinformatik. Herne
1991 (Verlag Neue Wirtschafts-Briefe).
[6]
Martin, W.: Data Warehousing Den Kunden besser verstehen.
In: Hannig, U. (Hrsg.): Data Warehouse und Managementinformationssysteme.
Stuttgart 1996 (Schäffer-Poeschel Verlag).
[7]
Schwarze, J.: Informationsmanagement. Herne 1998 (Verlag Neue
Wirtschafts-Briefe).
[8]
Otala, M.: Die lernende Organisation. In: Office Management 12(1994), S. 14-22.
|