Inhaltsverzeichnis
Online Analytical Processing
Definition
Akronym: OLAP
- Technik für multidimensionale Informationsabfragen
- bezeichnet den Zusammenhang zwischen Daten (Fakten) und Interpretation (Dimensionen)
- Fakten (z.B. Werte, Zahlen) können nach unterschiedlichen Dimensionen (z.B. Kundentyp, Angebote) ausgewertet werden
- Dimensionen können Hierarchien (z.B. Artikelgruppe → Artikel) besitzen
- Es gibt Navigations- und Verdichtungspfade (z.B.: Drill-Down, Drill-Up, Summen)
- Unterstützt schnelle, interaktive und vielfältige Zugriffe auf relevante und konsistente Informationen
- Bei operativen, relationalen Datenbanken werden Datenbestände normalisiert, d.h. in eine Vielzahl von Tabellen aufgeteilt → starke Fragmentierung der Daten und verarbeitungsbezogen
Ziele
- Schnelle, interaktive und vielfältige Zugriffe auf relevante und konsistente Informationen
- Im Vordergrund stehen dynamische und multidimensionale Analysen auf historischen, konsolidierten Datenbeständen
Navigation
Dice
Rotation des Datenwürfels durch Drehen oder Kippen, um eine andere Perspektive auf die Daten zu erhalten.
Slice
Herausschneiden einzelner Scheiben, Schichten oder kleiner Würfel aus dem Datenraum.
Drill-Down und Roll-Up
Verfeinerung (z.B. Europa → Deutschland) bzw. Vergröberung (z.B. Sachsen → Deutschland) der Auswahl
Regeln
- Mehrdimensionale konzeptionelle Perspektiven
- Betriebswirtschaftliche Maßzahlen (z.B.: Umsatzzahlen) sind erst im Kontext aussagekräftig (z.B.: nach Produkt, Region)
- Es müssen beliebige Projektionen (Schnitte) möglich sein
- Transparenz
- Nahtlose Integration der Analysekomponenten, sie sollten sich problemlos in die offene Architektur der Benutzerumgebung einbetten lassen
- Zugriffsmöglichkeit
- Datenzugriff auf möglichst viele heterogene unternehmensinterne und –externe Datenquellen und Datenformate
- Stabile Antwortzeiten bei der Berichterstattung
- Zu- und Abnahme der Anfragen sollen keinen Einfluss auf die Antwortzeiten haben
- Client- /Server Architektur
- Es muss eine verteilte Programmausführung als auch Datenhaltung möglich sein.
- Grundprinzipien der gleichgestellten Dimensionen
- Struktur der Dimensionen soll mit ihren Verwendungsmöglichkeiten übereinstimmen. Es existiert ein einheitlicher Befehlsumfang zum Aufbau, zur Strukturierung, Bearbeitung, Pflege und Auswertung der Dimensionen
- Dynamische Verwaltung „dünnbesetzter Matrizen“
- Für Betriebswirtschaftliche Matrizen sind geringe Besetzungsgrade (unter 10%) üblich, diese müssen durch optimale Speicherschemata effizient abgespeichert werden.
- Mehrbenutzerfähigkeit
- Die Daten müssen einer Gruppe von Nutzern mit Zugriffsrechten gleichzeitig zur Verfügung stehen
- Unbeschränkte kreuzdimensionale Operationen über Dimensionen hinweg
- Grundlage dafür ist eine vollständige, integrierte Datenmanipulationssprache und Systemoffenheit in Bezug auf die Abfragemöglichkeiten.
- Intuitive Datenmanipulation
- Das Arbeiten mit multidimensionalen Daten soll ohne größeren Lernaufwand möglich sein („Drill-Down“)
- Flexible Berichtswesen
- Es sollen leicht aussagekräftige Berichte erstellbar sein, dass System soll entsprechende dynamische Berichte und Grafiken unterstützen.
- Unbegrenzte Dimensions- und Aggregationsstufen
- Es soll eine unbegrenzte Anzahl an Dimensionen, Relationen und Variablen möglich sein
Kritik
- Unscharfe Trennung zwischen fachlich-konzeptioneller Anforderung und technischen Realisierungsaspekten
- Kritik aus der Praxis von Technologieanbietern
- FASMI (pragmatisch, technologiefrei)
- Fast – 1-2 Sekunden als Antwortzeit, bei einfachen Abfragen bis maximal 20 Sekunden für komplexe Datenanalyse
- Analysis – Verfahren und Techniken zu einfachen mathematischen Berechnungen und Strukturuntersuchungen
- Shared – Schutzmechanismen für den Zugriff im Mehrbenutzerbetrieb
- Multidimensional – Multidimensionale konzeptionelle Sicht auf Informationsobjekte, d.h. ohne Spezifikation der Datenbanktechnologie ist sicherzustellen, dass der Anwender freien Zugriff auf einen Datenwürfel hat und multiple Berichtshierarchien über die Dimensionen legen kann
- Information – alle relevanten Daten stehen zur Verfügung
Architekturvarianten
MOLAP
- Multidimensionale Speicherung
- Nutzt die spezielle Struktur dünnbesetzter Arrays zur Zugriffsoptimierung
- Marktgängige Produkte sind meist proprietär, sehr effizient aber im Volumen beschränkt
ROLAP
- Nutzung von relationalen Datenbanken
- Zusammengesetzte Primärschlüssel erzeugen in Faktentabellen den Effekt der Dimensionssichten
- Vorteil ist beliebige Skalierbarkeit relationaler Datenbanken, allerdings ist die Zugriffsgeschwindigkeit reduziert
HOLAP
- Nutzen beide Speicherkomponenten zur Optimierung von Zugriffsgeschwindigkeit und Datenablage