Reinforcement learning from human feedback
View the content before continuing.
Este exercício faz parte do curso
Google DeepMind: Fine-Tune Your Model
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício