Dummyvariabelen maken
Categorische features kunnen de modelprestatie verbeteren, omdat ze extra informatie kunnen toevoegen die bijdraagt aan de nauwkeurigheid van voorspellingen.
De music_df-gegevensset is alvast voor je ingeladen en de vorm (shape) is geprint. Ook is pandas als pd geïmporteerd.
Je gaat nu een nieuwe DataFrame maken met de originele kolommen van music_df plus dummyvariabelen uit de kolom "genre".
Deze oefening maakt deel uit van de cursus
Supervised Learning met scikit-learn
Oefeninstructies
- Gebruik een relevante functie, met de volledige DataFrame
music_df, ommusic_dummieste maken, waarbij je de eerste binaire kolom laat vallen. - Print de vorm (shape) van
music_dummies.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))