IniziaInizia gratis

Regressione con caratteristiche categoriche

Ora che hai creato music_dummies, contenente caratteristiche binarie per ogni genere di canzone, è il momento di costruire un modello di regressione di cresta per prevedere la popolarità della canzone.

music_dummies è stato precaricato per te, insieme a Ridge, cross_val_score, numpy come np, e un oggetto KFold memorizzato come kf.

Il modello verrà valutato calcolando l'RMSE medio, ma prima dovrai convertire i punteggi di ogni piega in valori positivi e prendere la loro radice quadrata. Questa metrica mostra l'errore medio delle previsioni del nostro modello, quindi può essere confrontata con la deviazione standard del valore target -"popularity".

Questo esercizio fa parte del corso

Apprendimento supervisionato con scikit-learn

Visualizza il corso

Istruzioni dell'esercizio

  • Crea X, che contiene tutte le caratteristiche di music_dummies, e y, che consiste nella colonna "popularity", rispettivamente.
  • Istanziare un modello di regressione ridge, impostando alpha uguale a 0,2.
  • Esegui una convalida incrociata su X e y utilizzando il modello ridge, impostando cv uguale a kf e utilizzando l'errore quadratico medio negativo come parametro di punteggio.
  • Stampa i valori di RMSE convertendo i valori negativi di scores in positivi e prendendo la radice quadrata.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create X and y
X = ____
y = ____

# Instantiate a ridge model
ridge = ____

# Perform cross-validation
scores = ____(____, ____, ____, cv=____, scoring="____")

# Calculate RMSE
rmse = np.____(____)
print("Average RMSE: {}".format(np.mean(rmse)))
print("Standard Deviation of the target array: {}".format(np.std(y)))
Modifica ed esegui il codice