Lexikon Data Mining

Data Mining

Was ist Data Mining?

Data Mining bezeichnet die systematische Nutzung computergestützter, statistischer Methoden zur Identifizierung von Mustern, Zusammenhängen und Trends in umfangreichen Datenbeständen (Big Data). Die hierfür eingesetzten Algorithmen kombinieren Erkenntnisse aus der IT, der Mathematik und der Statistik.
Lesedauer: 3:34 min

Wie funktioniert Data Mining?

Data Mining ist ein interdisziplinäres Betätigungsfeld. Es nutzt Erkenntnisse aus der Informatik, der Mathematik und der Statistik, um große Datenmengen zu analysieren. Die Rede ist hierbei auch von Big Data Analytics. Unter anderem werden Verfahren der künstlichen Intelligenz (KI) wie Machine Learning (ML) verwendet, um innerhalb von Big Data neue Muster, Trends und Querverbindungen zu identifizieren.

Data Mining ist ein Teil des sogenannten Knowledge-Discovery-in-Databases-Prozesses. Dieser Prozess dient der Wissensentdeckung in Datenbanken und läuft grob skizziert in folgenden Schritten ab:

  1. Fokussierung: Datenerhebung, Definieren von bereits vorhandenem Wissen
  2. Vorbereitung: Bereinigung der Daten
  3. Transformation: passendes Format für Analyse herstellen
  4. Data Mining: Durchführung der Analyse
  5. Evaluation: Überprüfung der identifizierten Muster durch Experten, Zielkontrolle

Welche Data-Mining-Methoden gibt es?

Allgemein sind vier Data-Mining-Methoden zu unterscheiden:

Data-Mining-MethodeBeschreibungAnwendungsbeispiel
KlassifikationSuche nach Mustern anhand bestimmter MerkmaleVorhersage von Produktaffinitäten eines Kunden
PrognoseSuche nach Mustern einer definierten ZielvariablePrognose des Umsatzes im kommenden Monat
Gruppierung (Segmentierung & Clustering)Identifizieren von Segmenten und Gruppen in DatenKundensegmentierung zur zielgenaueren Ausrichtung von Marketingmaßnahmen
Abhängigkeitsentdeckung (Assoziation & Sequenz)Suche nach Zusammenhängen und Abhängigkeiten in Daten in Form von RegelnWarenkorbanalyse im Online-Handel

Data Mining Beispiele

Eingesetzt werden Data-Mining-Verfahren mittlerweile in zahlreichen Branchen und Unternehmensbereichen:

  • Handel: Die Modelle eignen sich dazu, das Kundenverhalten zu analysieren und das zukünftige Kaufverhalten zu prognostizieren.
  • Marketing: Ein wichtiger Anwendungsbereich ist die Personalisierung im Marketing – also eine exakt auf den einzelnen Kunden zugeschnittene Kommunikation mit hohem Automatisierungsgrad.
  • Versicherungen & Banken: Sie nutzen Data-Mining-Verfahren hingegen zum Beispiel, um Risikoanalysen durchzuführen.
  • Text Mining: Hier werden Informationen und Muster aus Textdaten gewonnen. Ein häufiger Anwendungsfall ist, dass aus Texten schnell relevante Informationen herausgefiltert werden können.

Welche Vorteile hat Data Mining?

  • Höhere Kundenorientierung
  • Genaue Zukunftsprognosen
  • Erschließung bisher verborgener Informationen in Daten (Big Data)
  • Frühzeitige Erkennung von Trends und Anomalien
  • Datenbasierte Stützung von Entscheidungen
  • Optimierung und Automatisierung von Geschäftsprozessen
  • Maschinelle Verarbeitung von Bildern und Texten

Was sind die Risiken von Data Mining?

Data Mining und seine vielfältigen Möglichkeiten bietet immer wieder Diskussionsstoff. Folgende Punkte stehen dabei in der Kritik:

  • Fehlende oder falsche Daten führen zu falschen Ergebnissen
  • Komplexe Algorithmen und Datenmengen führen zu langen Laufzeiten
  • Datenschutz und Datensicherheit muss gewährleistet sein
  • Die abhängigen und unabhängigen Variablen, Klassen und Analysetechniken werden manuell festgelegt und sind deshalb durch Annahmen und Zielvorstellungen verfälscht
Autor Ertan Özdil

Autor dieses Artikels ist Ertan Özdil, CEO, Gründer und Gesellschafter des Cloud ERP-Anbieters weclapp.

Haftungsausschluss

Die Inhalte der Artikel sind als unverbindliche Informationen und Hinweise zu verstehen. Die weclapp GmbH übernimmt keine Gewähr für die inhaltliche Richtigkeit der Angaben.

Melde dich für unseren Newsletter an, um über neue Funktionen und Angebote auf dem Laufenden zu bleiben.

Die Software richtet sich an Unternehmen und darf nur von diesen genutzt werden. Sie ist nicht für die Nutzung durch Verbrauchende bestimmt.

Endlich richtig professionell.