Reinforcement Learning

In diesem Training erfahren Sie, wie Maschinen komplexe Abläufe und vorausschauendes Handeln lernen können. Mit diesem Ansatz fliegen autonome Helikopter Akrobatikmanöver und so wurde der Weltmeister in Go geschlagen. Ein Trainings-Datensatz mit den richtigen Antworten wird nicht benötigt, auch kein hart-codiertes Spezialwissen. Der Ansatz nennt sich Reinforcement Learning (RL) und ist fast schon magisch.

Wir werden sehen, wie sich eine praktische Fragestellung aus der realen Welt als Reinforcement-Learning-Problem formulieren lässt, welche Aufgaben für RL geeignet sind und für welche besser klassisches Machine Learning zum Zuge kommt. Mit einem begleitenden Python-Notebook implementieren wir schrittweise alle Lösungselemente, sehen die Funktionsweise einer modernen RL-Library, beleuchten die Rolle von neuronalen Netzen und loten Optimierungsmöglichkeiten aus.

Die Python-Notebooks sind auf Colab gehostet. Sie benötigen also lediglich einen Laptop mit einem aktuellen Chrome-Browser. Gerne diskutieren wir auch gemeinsam von Teilnehmerinnen und Teilnehmern mitgebrachte Anwendungsideen.

Vorkenntnisse

Basiskenntnisse in Programmierung und ein grundsätzliches Verständnis von neuronalen Netzen. Die Implementation erfolgt in Python, OpenAI Gym und TensorFlow. Spezifische Vorkenntnisse dazu sind aber keine Voraussetzung, um dem Workshop folgen zu können.

Lernziele

• Wie funktioniert Reinforcement Learning?
• Was sind die Voraussetzungen, um es anzuwenden?
• Wie wird es konkret angewandt?
• Aufbau eines aktuellen RL-Frameworks
• Hands-on Implementierung

Agenda

  • Einführung in die Konzepte von Reinforcement Learning
  • Fallbeispiel: anwenden der eingeführten Konzepte

Kaffeepause

  • Vertrautheit & Arbeiten mit Colab
  • Anwenden des Fallbeispiels auf OpenAI Gym
  • Trainieren des Fallbeispiels & Interpretation der Ergebnisse

 

Technische Anforderungen

Falls Sie ein Gerät Ihrer Firma verwenden, überprüfen Sie vorher bitte, ob eines der folgenden, gelegentlich vorkommenden Probleme bei Ihnen auftreten könnte.

  • Workshop-Teilnehmer hat keine Administratorrechte
  • Corporate Laptops mit übermäßig penibler Sicherheitssoftware
  • Gesetzte Corporate Proxys, über die man in der Firma kommunizieren muss, die aber in einer anderen Umgebung entsprechend nicht erreicht werden

Speaker

 

Oliver Zeigermann
Oliver Zeigermann ist Entwickler, Architekt, Berater und Coach. Er hat über Jahrzehnte in vielen unterschiedlichen Sprachen und mit vielen Technologien Software entwickelt. In den letzten Jahren ist er wieder tiefer in den Bereich Machine Learning eingestiegen. Er knüpft damit an sein Studium der Künstlichen Intelligenz in den 90er-Jahren an.

Christian Hidber
Christian Hidber arbeitet bei bSquare als Consultant mit Fokus auf Machine Learning, .Net und Azure. Nach seinem Mathematikstudium doktorierte er an der ETH Zürich und arbeitete als Postdoc am International Computer Science Institute in Berkeley (USA).

M3-Konferenz-Newsletter

Sie möchten über die ML Essentials
auf dem Laufenden gehalten werden? Dann abonnieren Sie den Newsletter der zugehörigen Konferenz Minds Mastering Machines (M3).

 

Anmelden