IniziaInizia gratis

Pipeline per la previsione della popolarità delle canzoni

Per l'esercizio finale, costruirai una pipeline per imputare i valori mancanti, scalare le caratteristiche ed eseguire la regolazione degli iperparametri di un modello di regressione logistica. L'obiettivo è quello di trovare i parametri e la precisione migliori per prevedere il genere di una canzone!

Tutti i modelli e gli oggetti necessari per costruire la pipeline sono stati precaricati.

Questo esercizio fa parte del corso

Apprendimento supervisionato con scikit-learn

Visualizza il corso

Istruzioni dell'esercizio

  • Crea le fasi della pipeline richiamando un imputer semplice, uno scaler standard e un modello di regressione logistica.
  • Crea un oggetto pipeline e passa la variabile steps.
  • Istanzia un oggetto di ricerca a griglia per eseguire la convalida incrociata utilizzando la pipeline e i parametri.
  • Stampa i parametri migliori e calcola e stampa il punteggio di accuratezza del set di prova per l'oggetto di ricerca a griglia.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create steps
steps = [("imp_mean", ____()), 
         ("scaler", ____()), 
         ("logreg", ____())]

# Set up pipeline
pipeline = ____(____)
params = {"logreg__solver": ["newton-cg", "saga", "lbfgs"],
         "logreg__C": np.linspace(0.001, 1.0, 10)}

# Create the GridSearchCV object
tuning = ____(____, param_grid=____)
tuning.fit(X_train, y_train)
y_pred = tuning.predict(X_test)

# Compute and print performance
print("Tuned Logistic Regression Parameters: {}, Accuracy: {}".format(____.____, ____.____))
Modifica ed esegui il codice