Extraindo prompts
Você está trabalhando com o conjunto de dados hendrydong/rlhf_helpful_eval, que contém textos de conversas entre um usuário (Human) e um assistente (Assistant). Seu objetivo é limpar o texto, preparando um prompt em que apenas o conteúdo relevante apareça, sem padrões nem tags específicas.
Escolha a opção que você usaria para limpar o conjunto de dados e extrair os prompts. Você pode ver um trecho de como o conjunto de dados é ao executar o seguinte código no console:
evaluation_data.iloc[range(1)]['text'][0]
Este exercício faz parte do curso
Reinforcement Learning from Human Feedback (RLHF)
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício