Website
KI-Weiterbildung Modulbeschreibungen

Automated Planning and Reinforcement Learning

CS4170-KP06

CS5071 Automated Planning and Acting

Mit automatischen Planungstechniken der KI können leistungsfähigere Anwendungen in kürzerer Zeit erstellt werden (z.B. zur Planng von Terminen, zur Konfiguration von Maschinen, zum Layout von Fabriken, usw.).

Planen und Handeln mit deterministischen Modellen bildet die Basis für das Lösen von Probleme durch intelligente Agenten. Die schrittweise Verfeinerung stellt dabei eine Methode dar, mit der Komplexität von Planungsproblemen fertig zu werden. Insbesondere werden auch Techniken zum Planen und Handeln mit temporalen Modellen in verschiedenen Anwendungen immer wichtiger. Das Modul bietet einen Überblick über in der Praxis bewährte Methoden.

Nicht immer kann ein handelnder Agent davon ausgehen, dass die geplanten Aktionen in der Realität tatsächlich auch die gewünschte Wirkung haben. Daher behandelt das Modul auch Planen und Handeln mit nicht-deterministischen bzw. auch probabilistischen Modellen und führt in die sequentielle Entscheidungstheorie ein, indem Verfahren für das Treffen von optimalen einfachen und komplexen Entscheidungen diskutiert werden.

Mit Techniken des Reinforcement wird eine Nachjustierung der Handlungsplanung während der praktischen Arbeit von intelligenten Agenten ermöglicht. Dieses ist besonders für praktische Anwendungen bedeutsam, in denen Modelle nicht a priori auf einfache Weise bereitgestellt werden können. Am Ende betrachten wir Menschen-zentriertes Handeln und schildern in der Praxis bewährte Planungsverfahren für intelligente Agenten, so dass ein beweisbar für Menschen nützliches Handeln von intelligenten Agenten erzeugt werden kann.

Die Vorlesung wird begleitet von einer seminaristischen Übung, in der Studierenden über weiterführende Ideen aus Originalpapieren berichten.

CS5430-S: Seminar Maschinelles Lernen

Im Seminar werden zentrale Ideen von Netzwerkformalismen studiert, so dass Techniken des Maschinellen Lernens angewendet werden können, um eine Verarbeitung von Eingabedaten innerhalb von handelnden Agenten möglichst fehlerfrei zu gestalten.