Creazione di variabili dummy
La possibilità di includere caratteristiche categoriche nel processo di costruzione del modello può migliorare le prestazioni, in quanto possono aggiungere informazioni che contribuiscono all'accuratezza della previsione.
Il dataset music_df è stato precaricato e la sua forma viene stampata. Inoltre, pandas è stato importato come pd.
Ora creerai un nuovo DataFrame contenente le colonne originali di music_df più le variabili fittizie della colonna "genre".
Questo esercizio fa parte del corso
Apprendimento supervisionato con scikit-learn
Istruzioni dell'esercizio
- Utilizza una funzione pertinente, passando l'intero DataFrame
music_df, per crearemusic_dummies, eliminando la prima colonna binaria. - Stampa la forma di
music_dummies.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))