CommencerCommencer gratuitement

Variables indicatrices

Dans le dernier exercice du cours, vous allez préparer vos données pour la modélisation en transformant vos colonnes non numériques en variables indicatrices. Par exemple, si vous avez une colonne de genres, 'Male' et 'Female', vous souhaitez créer des colonnes distinctes qui indiquent si l’observation correspond à 'Male' ou à 'Female'. Ce procédé de création de variables indicatrices s’appelle aussi le one-hot encoding.

Vous pouvez utiliser la fonction get_dummies() de pandas pour convertir les colonnes non numériques en variables indicatrices.

df_new = pd.get_dummies(df)

Nous avons extrait un sous-ensemble du DataFrame flights pour créer flights_sub, afin de faciliter la visualisation de ce qui se passe.

Cet exercice fait partie du cours

Python pour les utilisateurs de R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Look at the head of flights_sub
print(____)
Modifier et exécuter le code