Sélectionner des types de données spécifiques
Il est courant qu’un jeu de données contienne des colonnes avec plusieurs types de données différents (comme celui sur lequel vous travaillez). La plupart des modèles de Machine Learning exigent un type de données cohérent entre les variables. De même, la majorité des techniques de feature engineering ne s’appliquent qu’à un seul type de données à la fois. Pour ces raisons, entre autres, vous aurez souvent besoin d’accéder uniquement aux colonnes d’un certain type lorsque vous travaillez avec un DataFrame.
Le DataFrame (so_survey_df) de l’exercice précédent est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Feature engineering pour le Machine Learning en Python
Instructions
- Créez un sous-ensemble de
so_survey_dfcontenant uniquement les colonnes numériques (intetfloat). - Affichez les noms de colonnes contenus dans
so_survey_df_num.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create subset of only the numeric columns
so_numeric_df = so_survey_df.____(____=[____])
# Print the column names contained in so_survey_df_num
print(so_numeric_df.____)