Engenharia de atributos
Sua tarefa é prever se um novo grupo de solicitantes de empréstimo tende ou não a entrar em inadimplência. Você tem um conjunto de dados histórico e deseja treinar um classificador com ele. Você percebe que muitos atributos estão em formato de string, o que é um problema para seus classificadores. Por isso, você decide codificar as colunas de strings numericamente usando LabelEncoder(). A função já foi pré-carregada para você a partir do submódulo preprocessing do sklearn. O conjunto de dados credit também está pré-carregado, assim como a lista com os nomes de todas as colunas cujo tipo de dado é string, armazenada em non_numeric_columns.
Este exercício faz parte do curso
Projetando Workflows de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Inspect the first few lines of your data using head()
credit.____