Unsupervised Learning

Dieses Training richtet sich an Einsteiger mit soliden Python-Grundkenntnissen, die die Grundlagen des "unüberwachten" Machine Learnings kennen lernen möchten. In diesem Teilbereich des Machine Learning weiß man, in Abgrenzung zu den überwachten Lernverfahren, meist weniger über die Datenbasis und will eine Struktur darin erlernen.

Zusammen werden wir verschiedene Clustering-Algorithmen, Anomalie-Erkennung und Verfahren zur Dimensionsreduktion ergründen und mit Hilfe verschiedener Tools und Frameworks (Numpy, Scikit-Learn, Keras) implementieren.

Vorkenntnisse

* Solide Grundkenntnisse in Python (es werden aber separate Lösungen für alle praktischen Übungen gestellt).

Lernziele

* Maschine Learning selbst umsetzen
* Überblick und Abgrenzung verschiedener Clustering-Verfahren
* Anomalie-Detektion mit scikit-learn meistern.
* Autoencoder mit Keras implementieren
* Auf eigene Problemstellungen anwendbare Beispiele

Agenda

Theorie: Methoden des unüberwachten Lernens

Teil 1

  • Clustering: DBScan, KMeans
  • Hierarchical Clustering

Teil 2

  • Anomaly Detection
  • Dimension Reduction / Compression with auto-encoders
Praxis: Unüberwachte Verfahren umsetzen und sinnvoll einsetzen

Teil 1

  • Setup
  • KMeans

Teil 2

  • Local Outlier Factor
  • Autoencoder mit Keras

 

Technische Anforderungen

Wir stellen die Trainingsumgebung in einer Cloud-Instanz zur Verfügung. Ein aktueller Browser und ein freier Internetzugang genügt.

Wenn Sie die Umgebung aber auch nach dem Workshop noch nutzen wollen, benötigen Sie einen Laptop mit Administrationsrechten, einer Docker-Installation und mindestens 6 GB freiem Speicherplatz. Um den Download während des Workshops möglichst klein zu halten, sollten Sie im Voraus folgendes ausführen: docker pull novatec/ml-workshop-base

Da es durch Sicherheitssoftware auf Firmenlaptops leider immer wieder zu technischen Problemen (z.B. fehlende Administrationsrechte und Internetbeschränkungen) kommt, prüfen Sie bitte, ob Sie im Zweifel nicht einen privaten Laptop mitnehmen können.

Speaker

 

Arthur Varkentin
Arthur Varkentin arbeitet als Senior Consultant bei der Novatec Consulting GmbH und beschäftigt sich seit 2008 zuerst im Rahmen seiner Promotion an der Universität Stuttgart und später als Gründer des Spin-offs ScatterBlogs, mit der anwendungsnahen Kombination von Informationsvisualisierung und modelgetriebener Datenanalyse.

Hauke Brammer
Hauke Brammer arbeitet als Senior Consultant bei der Novatec Consulting GmbH. Hier unterstützt er Kunden in den Bereichen Application Development, Cloud-Anwendungen und Microservices. Als Topic Lead für Machine Learning interessiert er sich besonders für Data Augmentation und Deep-Learning mit Small- und Big Data.

M3-Konferenz-Newsletter

Sie möchten über die ML Essentials
auf dem Laufenden gehalten werden? Dann abonnieren Sie den Newsletter der zugehörigen Konferenz Minds Mastering Machines (M3).

 

Anmelden