Pipeline para previsão do gênero de músicas: II
Depois de configurar as etapas do pipeline no exercício anterior, agora você deve usá-lo no conjunto de dados music_df
para classificar o gênero das músicas. O que torna os pipelines incrivelmente úteis é a interface simples que oferecem.
X_train``X_test
, y_train
e y_test
já foram pré-carregados para você, e confusion_matrix
foi importado de sklearn.metrics
.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções de exercício
- Crie um pipeline usando as etapas que você definiu anteriormente.
- Ajuste o pipeline aos dados de treinamento.
- Faça previsões sobre o conjunto de teste.
- Calcule e imprima a matriz de confusão.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
steps = [("imputer", imp_mean),
("knn", knn)]
# Create the pipeline
pipeline = ____(____)
# Fit the pipeline to the training data
____
# Make predictions on the test set
y_pred = ____
# Print the confusion matrix
print(____(____, ____))