Aan de slagGa gratis aan de slag

Vergelijking en beoordeling in RLHF begrijpen

Nu ben jij aan de beurt. Stel, je ontwerpt een AI-assistent en je wilt het gebruikersgevoel meten. Je overweegt feedback te verzamelen op basis van vergelijkingen of, als alternatief, beoordelingen. Maar wat zijn de verschillen tussen die twee? Elke methode heeft z’n eigen kenmerken, en de juiste keuze kan het succes van je product sterk beïnvloeden.

Deze oefening maakt deel uit van de cursus

Reinforcement Learning from Human Feedback (RLHF)

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen