ComeçarComece de graça

Variáveis dummy

No último exercício do curso, você vai preparar seus dados para modelagem codificando em dummy suas colunas não numéricas. Por exemplo, se você tem uma coluna de gênero com valores 'Male' e 'Female', é melhor ter colunas separadas indicando se a observação é de um 'Male' ou de uma 'Female'. Esse processo de criação de variáveis dummy também é chamado de one-hot encoding.

Você pode usar a função get_dummies() do pandas para converter colunas não numéricas em variáveis dummy.

df_new = pd.get_dummies(df)

Reduzimos o DataFrame flights para criar flights_sub e facilitar a visualização do que está acontecendo.

Este exercício faz parte do curso

Python para usuários de R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Look at the head of flights_sub
print(____)
Editar e executar o código