Data Mining - Konzepte und Techniken (1025150)

Druckansicht
  • Dauer:
    2 Tage
  • Zielgruppe:
    Information Workers, IT Professionals
  • Vorkenntnisse:
    Allgemeine Kenntnisse der Mathematik
  • Methode:
    Vortrag mit Beispielen und Übungen.
  • Typ:
    Öffentliches Seminar / Inhouse
  • Download
    Anmeldeformular | AGB | Info-Broschüre
Themen:
Data Mining übertrifft einfache Analysetechniken an Wirkungsweise, Ergebnissen und bietet eine Methodik, die im Wesentlichen auf erweiterten statistischen Konzepten beruht. Es unterstützt die Entwicklung und Gewinnung von wertvollem Unternehmenswissen anhand hochkomplexer Analyseverfahren. Dieses Seminar macht Sie mit den Konzepten von Data Mining vertraut und hilft Ihnen bei der Entscheidung und Bewertung in Projekten, die Data Mining einführen helfen. Das Seminar zeigt den Teilnehmern aufgrund von Theorie und Beispielen, die sowohl selbst nachgerechnet wie auch mit Hilfe eines Data Mining-Werkzeugs nachvollzogen werden können, welche typischen Analyseverfahren zur Verfügung stehen und wie gängige Algorithmen in diesen Verfahren funktionieren. Es sind grundlegende Kenntnisse der Mathematik und Statistik notwendig, die bei Bedarf allerdings auch an den entsprechenden Stellen im Seminar noch einmal wiederholt werden.

Inhalte

A. Data Preprocessing

[0,125 Tage] Why Preprocess the Data? - Descriptive Data Summarization - Data Cleaning - Data Integration and Transformation - Data Reduction - Data Discretization and Concept Hierarchy Generation

B. Data Warehouse and OLAP Technology: An Overview

[0,25 Tage] What Is a Data Warehouse? - A Multidimensional Data Model - Data Warehouse Architecture - Data Warehouse Implementation - From Data Warehousing to Data Mining

C. Data Cube Computation and Data Generalization

[0,125 Tage] Efficient Methods for Data Cube Computation - Further Development of Data Cube and OLAP Technology - Attribute-Oriented Induction - An Alternative Method for Data Generalization and Concept Description

D. Mining Frequent Patterns, Associations, and Correlations

[0,5 Tage] Basic Concepts and a Road Map - Efficient and Scalable Frequent Itemset Mining Methods - Mining Various Kinds of Association Rules - From Association Mining to Correlation Analysis - Constraint-Based Association Mining

E. Classification and Prediction

[0,5 Tage] What Is Classification? What Is Prediction? - Issues Regarding Classification and Prediction - Classification by Decision Tree Induction - Bayesian Classification - Rule-Based Classification - Classification by Backpropagation - Support Vector Machines - Associative Classification: Classification by Association Rule Analysis - Lazy Learners (or Learning from Your Neighbors) - Other Classification Methods - Prediction - Accuracy and Error Measures - Evaluating the Accuracy of a Classifier or Predictor - Ensemble Methods: Increasing the Accuracy - Model Selection

F. Cluster Analysis

[0,5 Tage] What Is Cluster Analysis? - Types of Data in Cluster Analysis - A Categorization of Major Clustering Methods - Partitioning Methods - Hierarchical Methods - Density-Based Methods - Grid-Based Methods - Model-Based Clustering Methods - Clustering High-Dimensional Data - Constraint-Based Cluster Analysis - Outlier Analysis

Dozent:
Dr. Ralf Klinkenberg studierte Informatik an der Universität Dortmund, war dort von 1998 bis 2003 wissenschaftlicher Mitarbeiter und dann Doktorand am Lehrstuhl für Künstliche Intelligenz. Seine Interessen liegen im Bereich des maschinellen Lernens, des Data Mining und der Wissensentdeckung (Knowledge Discovery). Er arbeitet heute als Berater für Fragestellung aus den Bereichen Data Mining und Data Warehousing. Zu seinen zahlreichen wissenchaftlichen Veröffentlichungen gehört eine Reihe von Aufsätzen in wissenschaftlichen Magazinen zu den Themen Data Mining und Datenauswertung.
Marco Skulschus studierte Ökonomie in Wuppertal und Paris. Er arbeitet als Berater und Projektleiter in Data Warehousing- und Data Mining-Projekten für Unternehmen und staatliche Organisationen. Zu seinen Veröffentlichungen im Bereich empirische Sozialforschung gehört eine dreibändige Reihe zu Fragebogen-Systemen und innovativen mehrdimensionalen Frage-/Antwort-Darstellungen wie "Grundlagen empirische Sozialforschung, Befragung und Fragebogen im Unternehmen" (ISBN 978-3-939701-23-1).