Pipeline para previsão do gênero de músicas: I
Agora é hora de criar um pipeline. Ele deve conter etapas para imputar valores faltantes usando a média de cada variável independente e criar um modelo kNN para a classificação do gênero de músicas.
O conjunto de dados music_df
modificado que você criou no exercício anterior foi pré-carregado para você, juntamente com KNeighborsClassifier
e train_test_split
.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções de exercício
- Importe
SimpleImputer
comoPipeline
. - Instancie um imputador.
- Instancie um classificador kNN com três vizinhos.
- Crie
steps
, uma lista de tuplas contendo a variável imputadora que você criou, chamada"imputer"
, seguida do modeloknn
que você criou, chamado"knn"
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import modules
____
____
# Instantiate an imputer
imputer = ____()
# Instantiate a knn model
knn = ____
# Build steps for the pipeline
steps = [("____", ____),
("____", ____)]