Comece agoraComece grátis

Reinforcement learning from human feedback

View the content before continuing.

Este exercicio faz parte do curso

Google DeepMind: Fine-Tune Your Model

Ver curso

exercicio interativo prático

Transforme teoria em prática com um dos nossos exercicio interativos

Iniciar exercicio