Zurück

Reinforcement Learning

In diesem Training erfahren Sie, wie Maschinen komplexe Abläufe und vorausschauendes Handeln lernen können. Mit diesem Ansatz fliegen autonome Helikopter Akrobatikmanöver und so wurde der Weltmeister in Go geschlagen. Ein Trainings-Datensatz mit den richtigen Antworten wird nicht benötigt, auch kein hart-codiertes Spezialwissen. Der Ansatz nennt sich Reinforcement Learning (RL) und ist fast schon magisch.

Wir werden sehen, wie sich eine praktische Fragestellung aus der realen Welt als Reinforcement-Learning-Problem formulieren lässt, welche Aufgaben für RL geeignet sind und für welche besser klassisches Machine Learning zum Zuge kommt. Mit einem begleitenden Python-Notebook implementieren wir schrittweise alle Lösungselemente, sehen die Funktionsweise einer modernen RL-Library, beleuchten die Rolle von neuronalen Netzen und loten Optimierungsmöglichkeiten aus.

Die Python-Notebooks sind auf Colab gehostet. Sie benötigen also lediglich einen Laptop mit einem aktuellen Chrome-Browser. Gerne diskutieren wir auch gemeinsam von Teilnehmerinnen und Teilnehmern mitgebrachte Anwendungsideen.

Vorkenntnisse

Basiskenntnisse in Programmierung und ein grundsätzliches Verständnis von neuronalen Netzen. Die Implementation erfolgt in Python, OpenAI Gym und TensorFlow. Spezifische Vorkenntnisse dazu sind aber keine Voraussetzung, um dem Workshop folgen zu können.

Lernziele

• Wie funktioniert Reinforcement Learning?
• Was sind die Voraussetzungen, um es anzuwenden?
• Wie wird es konkret angewandt?
• Aufbau eines aktuellen RL-Frameworks
• Hands-on Implementierung

Agenda

Einführung in die Konzepte von Reinforcement Learning
Fallbeispiel: anwenden der eingeführten Konzepte

Kaffeepause

Vertrautheit & Arbeiten mit Colab
Anwenden des Fallbeispiels auf OpenAI Gym
Trainieren des Fallbeispiels & Interpretation der Ergebnisse

Technische Anforderungen

Laptop mit aktuellem Chrome Browser (wichtig, wir arbeiten mit Colab das läuft nicht in allem Browsern gleich erfreulich)
Google Account für Colab (https://colab.research.google.com/notebooks/welcome.ipynb)

Falls Sie ein Gerät Ihrer Firma verwenden, überprüfen Sie vorher bitte, ob eines der folgenden, gelegentlich vorkommenden Probleme bei Ihnen auftreten könnte.

Workshop-Teilnehmer hat keine Administratorrechte
Corporate Laptops mit übermäßig penibler Sicherheitssoftware
Gesetzte Corporate Proxys, über die man in der Firma kommunizieren muss, die aber in einer anderen Umgebung entsprechend nicht erreicht werden

Speaker

Oliver Zeigermann ist Entwickler, Architekt, Berater und Coach. Er hat über Jahrzehnte in vielen unterschiedlichen Sprachen und mit vielen Technologien Software entwickelt. In den letzten Jahren ist er wieder tiefer in den Bereich Machine Learning eingestiegen. Er knüpft damit an sein Studium der Künstlichen Intelligenz in den 90er-Jahren an.

Christian Hidber arbeitet bei bSquare als Consultant mit Fokus auf Machine Learning, .Net und Azure. Nach seinem Mathematikstudium doktorierte er an der ETH Zürich und arbeitete als Postdoc am International Computer Science Institute in Berkeley (USA).

Jetzt Tickets sichern