Encoder des variables catégorielles
Certaines colonnes du jeu de données sur les ovnis doivent être encodées avant de pouvoir être utilisées avec scikit-learn. Vous allez effectuer cette transformation ici, en utilisant à la fois un encodage binaire et un encodage one-hot.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Avec
apply(), écrivez une fonction conditionnellelambdaqui renvoie1si la valeur est"us", sinon renvoyez 0. - Affichez le nombre de valeurs
.unique()dans la colonnetype. - À l’aide de
pd.get_dummies(), créez un ensemble one-hot encodé à partir de la colonnetype. - Enfin, utilisez
pd.concat()pour concaténer les variables encodéestype_setau jeu de donnéesufo.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use pandas to encode us values as 1 and others as 0
ufo["country_enc"] = ufo["country"].____
# Print the number of unique type values
print(len(____.unique()))
# Create a one-hot encoded set of the type values
type_set = ____
# Concatenate this set back to the ufo DataFrame
ufo = pd.concat([____, ____], axis=1)