Reinforcement Learning (bestärkendes Lernen) ist eine Methode des Machine Learning, bei der ein KI-Agent durch Ausprobieren und Feedback lernt. Das System erhält eine Belohnung für gute Entscheidungen und eine Bestrafung für schlechte. Durch viele Wiederholungen lernt es, welche Aktionen in welchen Situationen am besten sind — ähnlich wie ein Kind, das durch Lob und Ermutigung lernt, bestimmte Verhaltensweisen zu wiederholen.
Im KI-Bereich wurde Reinforcement Learning berühmt, als ein System das komplexe Brettspiel Go gegen den menschlichen Weltmeister gewann. Für die Praxis relevanter ist, dass Reinforcement Learning from Human Feedback (RLHF) eine Schlüsseltechnologie bei der Entwicklung moderner Chatbots ist. ChatGPT wurde mithilfe von menschlichem Feedback trainiert, hilfreiche und sichere Antworten zu geben — das ist ein Beispiel für Reinforcement Learning.
Für den Grundschulkontext ist Reinforcement Learning vor allem als pädagogische Analogie interessant: Genau wie KI-Systeme durch Feedback lernen, lernen auch Kinder besser, wenn sie zeitnahes, konstruktives Feedback bekommen. Adaptive Lernsysteme nutzen Prinzipien des Reinforcement Learning, um Kindern zur richtigen Zeit die richtige Aufgabe zu geben — nicht zu leicht (langweilig) und nicht zu schwer (frustrierend), sondern im optimalen Lernbereich.