Modulbeschreibung

Data Engineering and Industrial Artificial Intelligence 2

Kurzzeichen:
M_DEIAI2
Unterrichtssprache:
Deutsch
ECTS-Credits:
4
Arbeitsaufwand (h):
120
Leitidee:

Die Kurse Data Analytics and Predictive Modelling vermittelt essenzielle Methoden der datengetriebenen Analyse und Modellierung und kombiniert damit zentrale Konzepte der Statistik, maschinellen Lernens und Datenvisualisierung. Die Studierenden erwerben ein umfassendes Verständnis für die Analyse, Aufbereitung und Interpretation von Daten sowie für die Entwicklung probabilistischer und deterministischer Modelle zur Vorhersage und Entscheidungsunterstützung. 

Der Kurs Data Analytics & Visualization legt den Fokus auf grundlegende Analysetechniken, Dimensionsreduktion und die Visualisierung komplexer Daten. Studierende lernen, große und heterogene Datensätze zu verarbeiten, geeignete Analyseverfahren wie Regressions- und Clusteranalyse anzuwenden und durch interaktive Visualisierungen datengetriebene Entscheidungen zu unterstützen. 

Parallel vermittelt Predictive Modelling die mathematischen und statistischen Grundlagen probabilistischer Modellierung sowie fortgeschrittene Techniken zur Vorhersage von Systemverhalten. Studierende vertiefen ihr Wissen in der Wahrscheinlichkeitsrechnung, lernen Regularisierungsverfahren für Regressionsmodelle sowie probabilistische Klassifikatoren und Clustering-Methoden wie Gaussian Mixture Models kennen. Darüber hinaus werden Bayes’sche Methoden und Sampling-Techniken zur Unsicherheitsquantifizierung behandelt. 

Die enge Verknüpfung beider Kurse ermöglicht es den Studierenden, datenbasierte Zusammenhänge zu erkennen, fundierte Vorhersagemodelle zu entwickeln und die gewonnenen Erkenntnisse durch Visualisierungen effektiv zu kommunizieren. Der praktische Bezug wird durch anwendungsorientierte Übungen und Implementierungen mit modernen Software-Tools verstärkt, insbesondere im Kontext industrieller und mechatronischer Anwendungen.

Modulverantwortung:
Prof. Dr. Würsch Christoph
Lehrpersonen:
Trémuel Philipp Gerard
Standort (angeboten):
Buchs, Lerchenfeld St.Gallen
Vorausgesetzte Module:
Zusätzliche Eingangskompetenzen:

Es sollte das Modul Analysis 3 besucht worden sein oder parallel dazu besucht werden.

Modultyp:
Wahlpflicht-Modul für Mechatronik BB STD_24(Empfohlenes Semester: 6)Kategorie:Vertiefungsmodule (Kat_VT_MT)
Wahlpflicht-Modul für Mechatronik VZ STD_24(Empfohlenes Semester: 4)Kategorie:Vertiefungsmodule (Kat_VT_MT)
Bemerkungen:

Das Modul findet im Frühlingssemester statt.

Modulbewertung:
Note von 1 - 6

Leistungsnachweise und deren Gewichtung

Modulschlussprüfung:
Schriftliche Prüfung, 120 Minuten
Bemerkungen zur Prüfung:

Die Modulschlussprüfung findet in zwei Teilen statt. Der erste Teil umfasst den Kurs Predictive Modelling  und der zweite Teil umfasst den Kurs Data Analytics & Visualization. Beide Teile dauern je 60 Minuten.  

Während der Unterrichtsphase:

Im Kurs Data Analytics & Visualization wird ein Projekt mittels Bericht, Präsentation und Fachgespräch bewertet.

Bewertungsart:
keine Note oder Wertung
Gewichtung:

Es findet eine abgesetzte Modulschlussprüfung in zwei Teilen statt. Der erste Teil umfasst den Kurs Predictive Modelling  (Gewicht 50%) und der zweite Teil umfasst den Kurs Data Analytics & Visualization (Gewicht 25%). Im Kurs Data Analytics & Visualization wird zusätzlich ein Projekt mittels Bericht, Präsentation und Fachgespräch (Gewicht 25%) bewertet.

Bemerkungen:

Inhalte

Angestrebte Lernergebnisse (Abschlusskompetenzen):

Der Kurs Data Analytics & Visualization vermittelt die wichtigsten Methoden der Datenanalyse und Visualisierung sowie deren praktische Anwendung. Die Studierenden lernen, verschiedene Datentypen aufzubereiten, gängige Python-Bibliotheken einzusetzen und zentrale Analysetechniken wie Regressionsanalyse, Clusteranalyse und Zeitreihenanalyse anzuwenden. Sie entwickeln Kompetenzen zur Interpretation von Datensätzen, um fundierte Entscheidungen zu treffen. 
Ein besonderer Fokus liegt auf der Erstellung und Bewertung von Visualisierungen, einschließlich interaktiver Dashboards. Zudem erwerben die Studierenden Kenntnisse in der Dimensionsreduktion und der Modellinterpretation mittels SHAP-Values. Abschließend wird der praktische Einsatz der erlernten Methoden in industriellen und mechatronischen Anwendungen behandelt. 

 

Die Studierenden

  • kennen die unterschiedlichen Data Analytics Teilbereiche/Methoden, deren Relevanz und Anwendungen. 
  • können mit unterschiedlichen Datensätzen umgehen (Datentypen, Fileformate) und können die Daten entsprechend für weitere Analysen aufbereiten. 
  • kennen die gängigen Python Data Analytics Bibliotheken und können diese auf individuelle Datensätze anwenden.  
  • verstehen das Prinzip der wichtigsten Data Analytics Techniken wie Regressionsanalyse, Monte-Carlo-Simulation, Statistische Methoden, Faktorenanalyse, Kohortenanalyse, Clusteranalyse, Zeitreihenanalyse und können diese anwenden. 
  • können anhand der Data Analytics Techniken Datensätze interpretieren und beurteilen und daraus Entscheidungen zu treffen. 
  • kennen die Bedeutung von Visualisierungen und sind in der Lage für einen gegebenen Datensatz und einer Zielsetzung eine geeignete Visualisierung zu erstellen. 
  • kennen die gängigen Python Visualisierungs-Bibliotheken und können diese anwenden. 
  • können interaktive Visualisierungen und Dashboards erstellen.
  • sind in der Lage Visualisierungen zu interpretieren und zu beurteilen daraus Entscheidungen zutreffen. 
  • kennen und verstehen Methoden der Dimensionsreduktion für Data Analytics und Visualisierung. 
  • verstehen die Anwendung von SHAP-Values zur Interpretierbarkeit von Machine-Learning-Modellen und können diese z.B. zur Feature-Importance-Analyse, Modelltransparenz, Fairnessbewertung, Identifikation von Feature-Interaktionen sowie zur Modelloptimierung gezielt einsetzen. 
  • kennen den praktischen Zusammenhang der gelernten Methoden und können diese auf industriellen und mechatronischen Problemstellungen anwenden. 
Modul- und Lerninhalt:
  1. Data Analytics Theorie I 
    a. Einführung & Grundlagen 
    b. Was ist Data Analytics? 
    c. Methoden und Technik 
  2. Data Analytics Theorie II 
    a. Datenquellen
    b. Datentypen
    c. Datenaufbereitung 
  3. Data Analytics Werkzeuge I 
    a. Pandas (hdf5, pickles, parquet) 
    b. Numpy
  4. Data Analytics Theorie III 
    a. Techniken 
    b. Regression 
    c. Statistik <
    d. Clustering
    e. Zeitreihen
    f. Feature Analysis
    g. Dimensionsreduktion 
  5. Data Analytics Werkzeuge II 
    a. Scipy
    b.Statsmodels
    c. Scikit-Learn 
  6. Data Visualization Theorie I 
    a. Einführung & Grundlagen
    b. Visualisierungsprinzipien (Grundlagen, Design, ...) 
  7. Data Visualization Werkzeuge I 
    a. Python (Matplotlib, Plotly, Seaborn) 
    b. Interaktive Plots 
  8. Data Visualization Werkzeuge II 
    a. Python 
    b. Dashboards 
    c. PowerBI 
    d. Tableau 
    e. Qluick 
  9. Data Visualization Theorie II 
    a. Dimensionsreduktion für die Visualisierung 
  10. Anwendungsbeispiele/Übungen/Begleitendes Projekt 
    a. Praktische Anwendungen (Marketing, Finanzen, Gesundheit, Industrie, Mechatronik, …) 
    b. Analyse von Datensätzen, Erstellung von Diagrammen und Dashboard 
Lehr- und Lernmethoden:

Vorlesung, Selbststudium, Übungen 
Der Praxisteil umfasst ein Projekt zur praxisorientierten Anwendung der in der Theorie erarbeiteten Inhalte. 

Lehrmittel/-materialien:

Vorlesungsskript 
 

  1. Handbuch Data Science mit Python: Grundlegende Tools für die Arbeit mit Daten, 2. Auflage, Jake VanderPlas 
  2. Python Data Visualization Cookbook, Second Edition, Igor Milovanivic
  3. Statistics and Data Visualization with Python, Second Edition, Jesus Rogel-Salazar 
  4. Data Analysis from Scratch with Python, Peters Morgan 
  5. Python for Data Analysis: Data Wrangling with pandas, Numpy & Jupyter, Third Edition, Wes McKinney 
Bemerkungen:

Unterrichtssprache Deutsch (Fachbegriffe und Material teilweise auf Englisch)