Création de variables nominales
La possibilité d’inclure des caractéristiques catégorielles dans le processus de construction du modèle peut améliorer les performances, car elles peuvent ajouter des informations qui contribuent à la précision de la prédiction.
L’ensemble de données music_df
a été préchargé pour vous et sa forme est affichée. pandas
a été importé en tant que pd
.
Vous allez maintenant créer un nouveau DataFrame contenant les colonnes originales de music_df
plus des variables fictives de la colonne "genre"
.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions d’exercice
- Utilisez une fonction appropriée, en passant l’ensemble du DataFrame
music_df
, pour créermusic_dummies
, en supprimant la première colonne binaire. - Affichez la forme de
music_dummies
.
Exercice interactif pratique
Essayez-vous à cet exercice en complétant cet exemple de code.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))