Regressione con caratteristiche categoriche
Ora che hai creato music_dummies, contenente caratteristiche binarie per ogni genere di canzone, è il momento di costruire un modello di regressione di cresta per prevedere la popolarità della canzone.
music_dummies è stato precaricato per te, insieme a Ridge, cross_val_score, numpy come np, e un oggetto KFold memorizzato come kf.
Il modello verrà valutato calcolando l'RMSE medio, ma prima dovrai convertire i punteggi di ogni piega in valori positivi e prendere la loro radice quadrata. Questa metrica mostra l'errore medio delle previsioni del nostro modello, quindi può essere confrontata con la deviazione standard del valore target -"popularity".
Questo esercizio fa parte del corso
Apprendimento supervisionato con scikit-learn
Istruzioni dell'esercizio
- Crea
X, che contiene tutte le caratteristiche dimusic_dummies, ey, che consiste nella colonna"popularity", rispettivamente. - Istanziare un modello di regressione ridge, impostando
alphauguale a 0,2. - Esegui una convalida incrociata su
Xeyutilizzando il modello ridge, impostandocvuguale akfe utilizzando l'errore quadratico medio negativo come parametro di punteggio. - Stampa i valori di RMSE convertendo i valori negativi di
scoresin positivi e prendendo la radice quadrata.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create X and y
X = ____
y = ____
# Instantiate a ridge model
ridge = ____
# Perform cross-validation
scores = ____(____, ____, ____, cv=____, scoring="____")
# Calculate RMSE
rmse = np.____(____)
print("Average RMSE: {}".format(np.mean(rmse)))
print("Standard Deviation of the target array: {}".format(np.std(y)))