CommencerCommencer gratuitement

Sélectionner des types de données spécifiques

Il est courant qu’un jeu de données contienne des colonnes avec plusieurs types de données différents (comme celui sur lequel vous travaillez). La plupart des modèles de Machine Learning exigent un type de données cohérent entre les variables. De même, la majorité des techniques de feature engineering ne s’appliquent qu’à un seul type de données à la fois. Pour ces raisons, entre autres, vous aurez souvent besoin d’accéder uniquement aux colonnes d’un certain type lorsque vous travaillez avec un DataFrame.

Le DataFrame (so_survey_df) de l’exercice précédent est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Feature engineering pour le Machine Learning en Python

Afficher le cours

Instructions

  • Créez un sous-ensemble de so_survey_df contenant uniquement les colonnes numériques (int et float).
  • Affichez les noms de colonnes contenus dans so_survey_df_num.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create subset of only the numeric columns
so_numeric_df = so_survey_df.____(____=[____])

# Print the column names contained in so_survey_df_num
print(so_numeric_df.____)
Modifier et exécuter le code