RL vs. RLHF
Was ist der wichtigste Unterschied zwischen Reinforcement Learning (RL) und Reinforcement Learning from Human Feedback (RLHF)?
Diese Übung ist Teil des Kurses
Reinforcement Learning aus menschlichem Feedback (RLHF)
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten