Variables indicatrices
Dans le dernier exercice du cours, vous allez préparer vos données pour la modélisation en transformant vos colonnes non numériques en variables indicatrices.
Par exemple, si vous avez une colonne de genres, 'Male' et 'Female', vous souhaitez créer des colonnes distinctes qui indiquent si l’observation correspond à 'Male' ou à 'Female'. Ce procédé de création de variables indicatrices s’appelle aussi le one-hot encoding.
Vous pouvez utiliser la fonction get_dummies() de pandas pour convertir les colonnes non numériques en variables indicatrices.
df_new = pd.get_dummies(df)
Nous avons extrait un sous-ensemble du DataFrame flights pour créer flights_sub, afin de faciliter la visualisation de ce qui se passe.
Cet exercice fait partie du cours
Python pour les utilisateurs de R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Look at the head of flights_sub
print(____)