Aan de slagGa gratis aan de slag

Training, afstemmen & feedback

Je werkt aan een project om een model te ontwikkelen met de Reinforcement Learning via Human Feedback (RLHF)-techniek om de prestaties te optimaliseren in een klantenservice-omgeving.

Welke van deze opties beschrijft het RLHF-proces het meest accuraat?

Deze oefening maakt deel uit van de cursus

Concepten van Large Language Models (LLMs)

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen