Création de variables nominales
La possibilité d’inclure des caractéristiques catégorielles dans le processus de construction du modèle peut améliorer les performances, car elles peuvent ajouter des informations qui contribuent à la précision de la prédiction.
L’ensemble de données music_df a été préchargé pour vous et sa forme est affichée. pandas a été importé en tant que pd.
Vous allez maintenant créer un nouveau DataFrame contenant les colonnes originales de music_df plus des variables fictives de la colonne "genre".
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Utilisez une fonction appropriée, en passant l’ensemble du DataFrame
music_df, pour créermusic_dummies, en supprimant la première colonne binaire. - Affichez la forme de
music_dummies.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))