Schlüsselthemen:
- Data Mining-Ansatz und Philosophie verstehen
- Assoziationsanalyse für einfache Mustererkennung nutzen
- Daten klassifizieren mit Entscheidungsbäumen, Künstlichen Neuronalen Netzen und Naïve Bayes
- Cluster-Analyse für Segmentierung von Daten nutzen
- Data Mining-Software kennenlernen
- Data Mining-Modelle bereitstellen und in Software einsetzen
A. Data Mining und MS SQL Server - Einführung
[Dauer: 0.5 Tage] Business Intelligence und Data Mining - Einsatzbereiche von Data Mining – Data Mining-Verfahren in Microsoft SQL Server und MS Excel – Server- und Client-Komponenten: MS SQL Server Analysis Services und Data Mining Add Ins für MS Excel und MS Visio - Aufgaben im Bereich Data Mining - Data Mining-Techniken im MS SQL Server - Projektzyklus (Datensammlung, Aufbereitung und Reinigung von Daten, Modellbildung, Modellbewertung, Reporting, Vorhersage, Integration in Anwendungen, Modellverwaltung)
B. Klassifikation mit Microsoft Decision Trees - Entscheidungsbäume
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung - DMX-Abfragen: Klassifikationsmodell, Regressionsmodell, Beziehungsmodell
C. Klassifikation mit Microsoft Naive Bayes
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung - DMX-Abfragen: Abhängigkeitsnetz, Attributprofile, Attributcharakteristika, Attributdiskrimierung
D. Microsoft Time Series - Zeitreihenanalyse
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung: Autoregression, Mehrere Zeitreihen, Saisonalität, Historische Vorhersagen, Vorhersagen cachen - DMX-Abfragen
E. Microsoft Clustering – Cluster Analyse
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung: Harte/weiche Clusterung, Skalierbare Clusterung, Geclusterte Vorhersagen - DMX-Abfragen: Cluster, Cluster-Wahrscheinlichkeit, Vorhersage-Histogramm, CaseLikelihood
F. Microsoft Sequence Clustering – Cluster Analyse
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung: Markov-Kette, Übergangsmatrix, Clusterung einer Markov-Kette, Dekomposition clustern - DMX-Abfragen
G. Microsoft Association Rules - Assoziationsanalyse
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung: Itemset, Unterstützung, Wahrscheinlichkeit/Konfidenz, Wichtigkeit/Wesentlichkeit - DMX-Abfragen
H. Microsoft Neural Network – Künstliche neuronale Netze
[Dauer: 0.25 Tage] Vorstellung des Algorithmus - Parameter - Modellaufbau und Modellverwendung: Kombination und Aktivierung, Normalisierung und Zuordnung, Topologie eines neuronalen Netzes, Modelltraining - DMX-Abfragen
I. Skripte für Data Mining
[Dauer: 0.5 Tage] XML/A (XML for Analysis): Skripte generieren und verwenden, Data Mining-Modelle aufbauen, verwalten und trainieren - DMX (Data Mining Extensions): Data Mining-Modelle aufbauen, verwalten und trainieren, Data Mining-Modelle abfragen
J. Integration und Reporting Services
[Dauer: 0.25 Tage] Data Mining-Modelle in Integration Services verwenden – Data Mining-Ergebnisse in Reporting Services aufrufen