Pipeline para previsão do gênero de músicas: I

Agora é hora de criar um pipeline. Ele deve conter etapas para imputar valores faltantes usando a média de cada variável independente e criar um modelo kNN para a classificação do gênero de músicas.

O conjunto de dados music_df modificado que você criou no exercício anterior foi pré-carregado para você, juntamente com KNeighborsClassifier e train_test_split.

Este exercício faz parte do curso

Aprendizado Supervisionado com o scikit-learn

Ver Curso

Instruções de exercício

  • Importe SimpleImputer como Pipeline.
  • Instancie um imputador.
  • Instancie um classificador kNN com três vizinhos.
  • Crie steps, uma lista de tuplas contendo a variável imputadora que você criou, chamada "imputer", seguida do modelo knn que você criou, chamado "knn".

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import modules
____
____

# Instantiate an imputer
imputer = ____()

# Instantiate a knn model
knn = ____

# Build steps for the pipeline
steps = [("____", ____), 
         ("____", ____)]