Pipeline per la previsione della popolarità delle canzoni
Per l'esercizio finale, costruirai una pipeline per imputare i valori mancanti, scalare le caratteristiche ed eseguire la regolazione degli iperparametri di un modello di regressione logistica. L'obiettivo è quello di trovare i parametri e la precisione migliori per prevedere il genere di una canzone!
Tutti i modelli e gli oggetti necessari per costruire la pipeline sono stati precaricati.
Questo esercizio fa parte del corso
Apprendimento supervisionato con scikit-learn
Istruzioni dell'esercizio
- Crea le fasi della pipeline richiamando un imputer semplice, uno scaler standard e un modello di regressione logistica.
- Crea un oggetto pipeline e passa la variabile
steps. - Istanzia un oggetto di ricerca a griglia per eseguire la convalida incrociata utilizzando la pipeline e i parametri.
- Stampa i parametri migliori e calcola e stampa il punteggio di accuratezza del set di prova per l'oggetto di ricerca a griglia.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create steps
steps = [("imp_mean", ____()),
("scaler", ____()),
("logreg", ____())]
# Set up pipeline
pipeline = ____(____)
params = {"logreg__solver": ["newton-cg", "saga", "lbfgs"],
"logreg__C": np.linspace(0.001, 1.0, 10)}
# Create the GridSearchCV object
tuning = ____(____, param_grid=____)
tuning.fit(X_train, y_train)
y_pred = tuning.predict(X_test)
# Compute and print performance
print("Tuned Logistic Regression Parameters: {}, Accuracy: {}".format(____.____, ____.____))