Lexikon Data Mining

Data Mining

Q: Wie funktioniert Data Mining?

Data Mining ist ein interdisziplinäres Betätigungsfeld. Es nutzt Erkenntnisse aus der Informatik, der Mathematik und der Statistik, um große Datenmengen zu analysieren. Die Rede ist hierbei auch von Big Data Analytics. Unter anderem werden Verfahren der künstlichen Intelligenz (KI) wie Machine Learning (ML) verwendet, um innerhalb von Big Data neue Muster, Trends und Querverbindungen zu identifizieren.

Was ist Data Mining?

Data Mining bezeichnet die systematische Nutzung computergestützter, statistischer Methoden zur Identifizierung von Mustern, Zusammenhängen und Trends in umfangreichen Datenbeständen (Big Data). Die hierfür eingesetzten Algorithmen kombinieren Erkenntnisse aus der IT, der Mathematik und der Statistik.

Lesedauer: 3:34 min

Wie funktioniert Data Mining?

Data Mining ist ein interdisziplinäres Betätigungsfeld. Es nutzt Erkenntnisse aus der Informatik, der Mathematik und der Statistik, um große Datenmengen zu analysieren. Die Rede ist hierbei auch von Big Data Analytics. Unter anderem werden Verfahren der künstlichen Intelligenz (KI) wie Machine Learning (ML) verwendet, um innerhalb von Big Data neue Muster, Trends und Querverbindungen zu identifizieren.

Data Mining ist ein Teil des sogenannten Knowledge-Discovery-in-Databases-Prozesses. Dieser Prozess dient der Wissensentdeckung in Datenbanken und läuft grob skizziert in folgenden Schritten ab:

Fokussierung: Datenerhebung, Definieren von bereits vorhandenem Wissen
Vorbereitung: Bereinigung der Daten
Transformation: passendes Format für Analyse herstellen
Data Mining: Durchführung der Analyse
Evaluation: Überprüfung der identifizierten Muster durch Experten, Zielkontrolle

Welche Data-Mining-Methoden gibt es?

Allgemein sind vier Data-Mining-Methoden zu unterscheiden:

Data-Mining-Methode	Beschreibung	Anwendungsbeispiel
Klassifikation	Suche nach Mustern anhand bestimmter Merkmale	Vorhersage von Produktaffinitäten eines Kunden
Prognose	Suche nach Mustern einer definierten Zielvariable	Prognose des Umsatzes im kommenden Monat
Gruppierung (Segmentierung & Clustering)	Identifizieren von Segmenten und Gruppen in Daten	Kundensegmentierung zur zielgenaueren Ausrichtung von Marketingmaßnahmen
Abhängigkeitsentdeckung (Assoziation & Sequenz)	Suche nach Zusammenhängen und Abhängigkeiten in Daten in Form von Regeln	Warenkorbanalyse im Online-Handel

Data Mining Beispiele

Eingesetzt werden Data-Mining-Verfahren mittlerweile in zahlreichen Branchen und Unternehmensbereichen:

Handel: Die Modelle eignen sich dazu, das Kundenverhalten zu analysieren und das zukünftige Kaufverhalten zu prognostizieren.
Marketing: Ein wichtiger Anwendungsbereich ist die Personalisierung im Marketing – also eine exakt auf den einzelnen Kunden zugeschnittene Kommunikation mit hohem Automatisierungsgrad.
Versicherungen & Banken: Sie nutzen Data-Mining-Verfahren hingegen zum Beispiel, um Risikoanalysen durchzuführen.
Text Mining: Hier werden Informationen und Muster aus Textdaten gewonnen. Ein häufiger Anwendungsfall ist, dass aus Texten schnell relevante Informationen herausgefiltert werden können.

Welche Vorteile hat Data Mining?

Höhere Kundenorientierung
Genaue Zukunftsprognosen
Erschließung bisher verborgener Informationen in Daten (Big Data)
Frühzeitige Erkennung von Trends und Anomalien
Datenbasierte Stützung von Entscheidungen
Optimierung und Automatisierung von Geschäftsprozessen
Maschinelle Verarbeitung von Bildern und Texten

Was sind die Risiken von Data Mining?

Data Mining und seine vielfältigen Möglichkeiten bietet immer wieder Diskussionsstoff. Folgende Punkte stehen dabei in der Kritik:

Fehlende oder falsche Daten führen zu falschen Ergebnissen
Komplexe Algorithmen und Datenmengen führen zu langen Laufzeiten
Datenschutz und Datensicherheit muss gewährleistet sein
Die abhängigen und unabhängigen Variablen, Klassen und Analysetechniken werden manuell festgelegt und sind deshalb durch Annahmen und Zielvorstellungen verfälscht

Autor dieses Artikels ist Ertan Özdil, CEO, Gründer und Gesellschafter des Cloud ERP-Anbieters weclapp.

Was ist weclapp?

Mit weclapp können Teams alle wichtigen Unternehmensprozesse auf einer Cloud ERP-Plattform gemeinsam steuern. Ob CRM, Warenwirtschaft oder Buchhaltungssoftware: Jedes Modul der smarten ERP-Software entwickeln wir konsequent aus den Anforderungen moderner Teamarbeit heraus. So lassen sich alle Informationen zu Kunden, Projekten, Angeboten, Rechnungen, Artikeln und Bestellungen spielend einfach gemeinsam verwalten. weclapp gehört zu den beliebtesten Lösungen am Markt und wurde bereits 4 Mal als ERP-System des Jahres ausgezeichnet.