Dummy-Variablen erstellen
Die Möglichkeit, kategoriale Merkmale in den Modellbildungsprozess einzubeziehen, kann die Leistung verbessern, da sie Informationen hinzufügen können, die zur Vorhersagegenauigkeit beitragen.
Der Datensatz music_df
wurde für dich vorgeladen und seine Form ausgegeben. Außerdem wurde pandas
als pd
importiert.
Jetzt erstellst du einen neuen DataFrame, der die ursprünglichen Spalten von music_df
sowie Dummy-Variablen aus der Spalte "genre"
enthält.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Verwende eine entsprechende Funktion und übergib den gesamten
music_df
-DataFrame, ummusic_dummies
zu erstellen, und verwirf dabei die erste Binärspalte. - Drucke die Form von
music_dummies
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))