CommencerCommencez gratuitement

Création de variables nominales

La possibilité d’inclure des caractéristiques catégorielles dans le processus de construction du modèle peut améliorer les performances, car elles peuvent ajouter des informations qui contribuent à la précision de la prédiction.

L’ensemble de données music_df a été préchargé pour vous et sa forme est affichée. pandas a été importé en tant que pd.

Vous allez maintenant créer un nouveau DataFrame contenant les colonnes originales de music_df plus des variables fictives de la colonne "genre".

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions d’exercice

  • Utilisez une fonction appropriée, en passant l’ensemble du DataFrame music_df, pour créer music_dummies, en supprimant la première colonne binaire.
  • Affichez la forme de music_dummies.

Exercice interactif pratique

Essayez-vous à cet exercice en complétant cet exemple de code.

# Create music_dummies
music_dummies = ____

# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))
Modifier et exécuter du code