CommencerCommencer gratuitement

À quoi ressemblent vos données ? (I)

Jusqu’ici, vous vous êtes concentré sur la création de nouvelles features et la gestion des problèmes présents dans vos données. Le feature engineering peut aussi vous aider à tirer le meilleur parti des données que vous avez déjà et à les utiliser plus efficacement lors de la création de modèles de Machine Learning.
De nombreux algorithmes supposent que vos données suivent une loi normale, ou au moins que toutes vos colonnes sont sur la même échelle. C’est rarement le cas : par exemple, une feature peut être exprimée en milliers de dollars tandis qu’une autre représente un nombre d’années. Dans cet exercice, vous allez créer des graphiques pour examiner la distribution de certaines colonnes numériques du DataFrame so_survey_df, stockées dans so_numeric_df.

Cet exercice fait partie du cours

Feature engineering pour le Machine Learning en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a histogram
____
plt.show()
Modifier et exécuter le code