Canalización para la predicción del género de las canciones: II

Una vez configurados los pasos del pipeline en el ejercicio anterior, ahora lo utilizarás en el conjunto de datos music_df para clasificar el género de las canciones. Lo que hace que las canalizaciones sean tan increíblemente útiles es la sencilla interfaz que proporcionan.

X_train, X_test, y_train, y y_test han sido precargados para ti, y confusion_matrix ha sido importado de sklearn.metrics.

Este ejercicio forma parte del curso

Aprendizaje supervisado con scikit-learn

Ver curso

Instrucciones de ejercicio

  • Crea una canalización utilizando los pasos que definiste anteriormente.
  • Ajusta la canalización a los datos de entrenamiento.
  • Haz predicciones sobre el conjunto de pruebas.
  • Calcula e imprime la matriz de confusión.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

steps = [("imputer", imp_mean),
        ("knn", knn)]

# Create the pipeline
pipeline = ____(____)

# Fit the pipeline to the training data
____

# Make predictions on the test set
y_pred = ____

# Print the confusion matrix
print(____(____, ____))