Die Studierenden
Elektrotechnik & Lineare Algebra 1 und 2
Das Modul findet im Frühlingssemester statt und wird Online angeboten.
Das Fachgespräch zum Projekt findet mündlich statt und dauert 20 Minuten.
Es wird ein Projekt bewertet.
Während der Unterrichtsphase wird eine Projektarbeit mittels Bericht (Gewicht 50%) und einem Fachgespräch (Gewicht 50%) bewertet.
Die Studierenden
Deep Learning ist eine Klasse moderner Methoden des maschinellen Lernens, bei denen neuronale Netze als parametrisierte Modelle verstanden werden, die durch die Lösung eines Optimierungsproblems trainiert werden. Der Lernprozess basiert auf der Anpassung von Modellparametern mittels Backpropagation und iterativer Optimierungsverfahren, wobei Daten, Zielfunktion (Loss), Optimierer und Bewertungsmetriken gemeinsam den Trainingsprozess bestimmen. Durch die Kombination fortgeschrittener Optimierungsalgorithmen mit spezialisierten Architekturbausteinen ist es möglich, neuronale Netze zu entwickeln, die komplexe Datenstrukturen wie Tabellendaten, Bilder, Text und Audiosignale sowohl als Eingabe als auch als Ausgabe verarbeiten können. Deep Learning erlaubt es, hierarchische Repräsentationen von Daten zu lernen, die in ihrer Struktur funktionalen Prinzipien des menschlichen Gehirns ähneln.
Dieser Kurs führt die Teilnehmer in klassische neuronale Netzwerkarchitekturen ein, darunter Multilayer Perceptrons (MLP), Convolutional Neural Networks (CNN), rekurrente Netzwerke wie Long Short-Term Memory (LSTM) und Gated Recurrent Units (GRU) sowie Autoencoder (AE). Neben diskriminativen Modellen werden auch generative Modellansätze behandelt, die es erlauben, neue Daten wie Texte, Zeitreihen oder Bilder zu erzeugen. Darüber hinaus erhalten die Studierenden einen Einblick in moderne generative Architekturen wie Transformer-Modelle, wobei insbesondere das Prinzip des Attention-Mechanismus und dessen Bedeutung für die Verarbeitung langer Sequenzen in der natürlichen Sprachverarbeitung und Datengenerierung erläutert wird.
Anwendungsbeispiele aus den Bereichen Computer Vision, Zeitreihenanalyse, Sicherheit, Natural Language Processing (NLP) und Datengenerierung verdeutlichen die praktische Relevanz der behandelten Methoden. Aspekte des High Performance Computing (HPC) zeigen, wie Deep Learning effizient auf grafischen Verarbeitungseinheiten (GPUs) sowie auf verteilten Rechensystemen eingesetzt werden kann.
Der Schwerpunkt des Kurses liegt auf der praktischen Anwendung von Deep-Learning-Methoden, ergänzt durch eine Einführung in die zugrunde liegenden mathematischen Konzepte. Die Studierenden implementieren und trainieren neuronale Netze mit der Programmiersprache Python unter Verwendung von PyTorch und/oder Keras.
Unterrichtsgespräch im Klassenverband (Online)
Selbststudium (Übungen, Vor- und Nachbereitung der Lerninhalte)
Projektarbeit
Durchführung gemäss Stundenplan
Die Unterrichtssprache ist deutsch, teile der Literatur können in Englisch sein.