5.6 Technik
Bei normalen Auswertungen von Datenbeständen (z. B. durch OLAP) können bestimmte, vorher festgelegte Fragestellungen bearbeitet werden. Zum Beispiel: Wie viele meiner Kunden sind zwischen 20 und 40 Jahre alt und leben in München. Beim Data-Mining werden die Datenbestände nach Regelmäßigkeiten, Mustern und Strukturen, Abweichungen und jeglicher Art von Beziehungen und gegenseitigen Beeinflussungen untersucht. Der Prozess der Mustererkennung und Wissensextraktion wird auch „Wissensentdeckung in Datenbanken“ genannt. Im Data-Mining, als einem kreativen Prozess, werden im Arbeitsfortschritt Hypothesen entwickelt und überprüft.
Verschiedene Data-Mining-Verfahren sind:
Gruppierung von Objekten aufgrund von Ähnlichkeiten
Identifikation und Extraktion weniger systembestimmender Faktoren
datenreduzierendeInformationsverdichtung durch Bündelung mehrerer Variablen zu wenigen Faktoren
z. B. Warenkorbanalyse
Einordnung von Objekten in bestimmte Klassen und Kategorien
Klassifikation von Objekten unbekannter Klassenzugehörigkeit
Darstellung aufeinanderfolgender, hierarchischer Entscheidungen
auch: Sensitivitätsanalyse; Einfluss von Faktoren auf bestimmte Ergebnisgrößen
Identifikation von Beziehungen zwischen einer abhängigen und einer oder mehrerer unabhängigen Variablen
Überführung beliebiger Eingabemuster in das gewünschte Ausgabemuster
Aufteilung von Objekten in zwei Klassen unter Maximierung des Abstands zur Klassengrenze