Data Mining

Was ist Data Mining?

Data Mining bezeichnet die systematische Nutzung computergestützter, statistischer Methoden zur Identifizierung von Mustern, Zusammenhängen und Trends in umfangreichen Datenbeständen (Big Data). Die hierfür eingesetzten Algorithmen kombinieren Erkenntnisse aus der IT, der Mathematik und der Statistik.

Inhaltsverzeichnis
    Add a header to begin generating the table of contents
    Lesedauer: 3:34min

    Wie funktioniert Data Mining?

    Data Mining ist ein interdisziplinäres Betätigungsfeld. Es nutzt Erkenntnisse aus der Informatik, der Mathematik und der Statistik, um große Datenmengen zu analysieren. Die Rede ist hierbei auch von Big Data Analytics. Unter anderem werden Verfahren der künstlichen Intelligenz (KI) wie Machine Learning (ML) verwendet, um innerhalb von Big Data neue Muster, Trends und Querverbindungen zu identifizieren.

    Data Mining ist ein Teil des sogenannten Knowledge-Discovery-in-Databases-Prozesses. Dieser Prozess dient der Wissensentdeckung in Datenbanken und läuft grob skizziert in folgenden Schritten ab:

    1. Fokussierung: Datenerhebung, Definieren von bereits vorhandenem Wissen
    2. Vorbereitung: Bereinigung der Daten
    3. Transformation: passendes Format für Analyse herstellen
    4. Data Mining: Durchführung der Analyse
    5. Evaluation: Überprüfung der identifizierten Muster durch Experten, Zielkontrolle
     

    Welche Data-Mining-Methoden gibt es?

    Allgemein sind vier Data-Mining-Methoden zu unterscheiden:

    Data-Mining-Methode Beschreibung Anwendungsbeispiel
    Klassifikation Suche nach Mustern anhand bestimmter Merkmale Vorhersage von Produktaffinitäten eines Kunden
    Prognose Suche nach Mustern einer definierten Zielvariable Prognose des Umsatzes im kommenden Monat
    Gruppierung (Segmentierung & Clustering) Identifizieren von Segmenten und Gruppen in Daten Kundensegmentierung zur zielgenaueren Ausrichtung von Marketingmaßnahmen
    Abhänigkeitsentdeckung (Assoziation & Sequenz) Suche nach Zusammenhängen und Abhängigkeiten in Daten in Form von Regeln Warenkorbanalyse im Online-Handel

    Data Mining Beispiele

    Eingesetzt werden Data-Mining-Verfahren mittlerweile in zahlreichen Branchen und Unternehmensbereichen:

    • Handel: Die Modelle eignen sich dazu, das Kundenverhalten zu analysieren und das zukünftige Kaufverhalten zu prognostizieren.
    • Marketing: Ein wichtiger Anwendungsbereich ist die Personalisierung im Marketing – also eine exakt auf den einzelnen Kunden zugeschnittene Kommunikation mit hohem Automatisierungsgrad.
    • Versicherungen & Banken: Sie nutzen Data-Mining-Verfahren hingegen zum Beispiel, um Risikoanalysen durchzuführen.
    • Text Mining: Hier werden Informationen und Muster aus Textdaten gewonnen. Ein häufiger Anwendungsfall ist, dass aus Texten schnell relevante Informationen herausgefiltert werden können.
     

    Welche Vorteile hat Data Mining?

    • Höhere Kundenorientierung
    • Genaue Zukunftsprognosen
    • Erschließung bisher verborgener Informationen in Daten (Big Data)
    • Frühzeitige Erkennung von Trends und Anomalien
    • Datenbasierte Stützung von Entscheidungen
    • Optimierung und Automatisierung von Geschäftsprozessen
    • Maschinelle Verarbeitung von Bildern und Texten
     

    Was sind die Risiken von Data Mining?

    Data Mining und seine vielfältigen Möglichkeiten bietet immer wieder Diskussionsstoff. Folgende Punkte stehen dabei in der Kritik:

    • Fehlende oder falsche Daten führen zu falschen Ergebnissen
    • Komplexe Algorithmen und Datenmengen führen zu langen Laufzeiten
    • Datenschutz und Datensicherheit muss gewährleistet sein
    • Die abhängigen und unabhängigen Variablen, Klassen und Analysetechniken werden manuell festgelegt und sind deshalb durch Annahmen und Zielvorstellungen verfälscht

    Spannende Beiträge rund um Unternehmertum, ERP, Buchhaltung, CRM und Software:

    Autor Ertan Özdil
    Autor dieses Artikels ist , CEO, Gründer und Gesellschafter des Cloud ERP-Anbieters weclapp.