Aan de slagGa gratis aan de slag

Dummyvariabelen maken

Categorische features kunnen de modelprestatie verbeteren, omdat ze extra informatie kunnen toevoegen die bijdraagt aan de nauwkeurigheid van voorspellingen.

De music_df-gegevensset is alvast voor je ingeladen en de vorm (shape) is geprint. Ook is pandas als pd geïmporteerd.

Je gaat nu een nieuwe DataFrame maken met de originele kolommen van music_df plus dummyvariabelen uit de kolom "genre".

Deze oefening maakt deel uit van de cursus

Supervised Learning met scikit-learn

Cursus bekijken

Oefeninstructies

  • Gebruik een relevante functie, met de volledige DataFrame music_df, om music_dummies te maken, waarbij je de eerste binaire kolom laat vallen.
  • Print de vorm (shape) van music_dummies.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create music_dummies
music_dummies = ____

# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))
Code bewerken en uitvoeren