Vergleich und Bewertung in RLHF verstehen
Jetzt bist du dran. Stell dir vor, du entwirfst einen KI-Assistenten und möchtest die Nutzerzufriedenheit verstehen. Du überlegst, vergleichsbasiertes Feedback zu sammeln oder alternativ Bewertungen. Aber worin unterscheiden sich die beiden? Jede Methode hat ihre eigenen Merkmale, und die richtige Wahl kann den Erfolg deines Produkts stark beeinflussen.
Diese Übung ist Teil des Kurses
Reinforcement Learning aus menschlichem Feedback (RLHF)
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten