Data Mining

Definition

Data Mining ist eine Technik des analytischen CRM, bei der Methodenansätze aus Statistik, Künstlicher Intelligenz, Maschinellem Lernen und Mustererkennung genutzt werden, um die Zusammenhänge zwischen Kundenverhalten und der Gestaltung kundenorientierter Geschäftsprozesse zu untersuchen.

Damit zählt Data Mining zu den prospektiven (zukunftsgerichteten) Verfahren im Business Intelligence. Ziel sind unter Anderem Vorhersagen zu folgenden Fragen

  • Welche Kunden würden vielleicht weitere Produkte kaufen?
  • Welche Kunden können entwickelt werden?
  • Welche Kunden werden bei der Konkurrenz kaufen?

Beispiel: Kündigeranalyse, bei der nach Variablen mit einem möglichst starken Zusammenhang zum Kündigungsverhalten gesucht, wodurch später entsprechende Kundensegmente ermittelte werden können.

Der Data Mining Prozess umfasst die Auswahl, Bereinigung, Transformation und die eigentliche Analyse der Daten. Die Ergebnisse des Date Mining müssen abschließend interpretiert und evaluiert werden.

Ansätze des Date Mining sind

  • Visualisierungstechniken
  • Clusterverfahren
  • Entscheidungsbaumverfahren
  • Konnektionistische Systeme bzw. Künstliche Neuronale Netze

Fragestellungen

  • classification: Klassifikation mittels Fragestellungen
  • segmentation: dient der Gruppenbildung
  • estimation: Abschätzungen & Zukunftsprognosen
  • association: Erkennen von Beziehungen
  • forecasting: Konkrete Vorhersagen aufgrund historischer Daten (z.B. Analyse der letzten 5 Jahre → Umsatzprognose für kommendes Jahr)

Verfahren

Beim Data Mining kommen verschiedene mathematische Algorithmen bzw. Modelle zur Filterung zum Einsatz.

  • Clusterverfahren: Realisierung von Gruppierungen
  • Entscheidungsbäume:
    • gehört neben Clusterverfahren zu den am häufigsten eingesetzten
    • sucht sich die Inputparameter heraus, die den größten Einfluss haben
    • Spezialfall: lineare Regression
  • Visualisierungstechniken: Werden zusammen mit Clusterverfahren z.B. für Cross-Selling Aktionen genutzt
  • Naive Bayes: Einfacher Algorithmus für schnelle Vorhersagen → Wahrscheinlichkeitstheorie
  • Neuronale Netze
  • Sequence Clustering: Gruppierung unter bestimmter Reihenfolge
  • Zeitreihenvorhersagen
  • Beziehungsaufdeckung

Kontext

Weiterführende Beiträge


Navigation

Alphabetischer Index
Akronyme