CommencerCommencer gratuitement

Encoder des variables catégorielles

Certaines colonnes du jeu de données sur les ovnis doivent être encodées avant de pouvoir être utilisées avec scikit-learn. Vous allez effectuer cette transformation ici, en utilisant à la fois un encodage binaire et un encodage one-hot.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Avec apply(), écrivez une fonction conditionnelle lambda qui renvoie 1 si la valeur est "us", sinon renvoyez 0.
  • Affichez le nombre de valeurs .unique() dans la colonne type.
  • À l’aide de pd.get_dummies(), créez un ensemble one-hot encodé à partir de la colonne type.
  • Enfin, utilisez pd.concat() pour concaténer les variables encodées type_set au jeu de données ufo.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Use pandas to encode us values as 1 and others as 0
ufo["country_enc"] = ufo["country"].____

# Print the number of unique type values
print(len(____.unique()))

# Create a one-hot encoded set of the type values
type_set = ____

# Concatenate this set back to the ufo DataFrame
ufo = pd.concat([____, ____], axis=1)
Modifier et exécuter le code