Un premier aperçu
En utilisant l’intégralité du jeu de données Avazu, vous allez explorer de nouvelles fonctionnalités en examinant les types de données des colonnes. Les nouvelles données comprennent des colonnes catégorielles telles que site_id, app_id, device_id, etc., qui sont différentes formes d’identifiants pour un site, une application et un utilisateur, respectivement. Pour commencer, vous allez identifier et afficher les colonnes numériques et les colonnes catégorielles.
Des données d’exemple sous forme de DataFrame sont chargées dans df. pandas sous l’alias pd est également disponible dans votre espace de travail.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Instructions
- Affichez les colonnes de
dfavec.columns. - Affichez les types de données correspondants de
dfavec.dtypes. - Sélectionnez le sous-ensemble de
dfcontenant les colonnes numériques (en utilisantinclude = ['int', 'float']) et affichez ces colonnes. - Sélectionnez le sous-ensemble de
dfcontenant les colonnes catégorielles (en utilisantinclude = ['object']) et affichez ces colonnes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print columns
print(df.____)
# Print data types of columns
print(df.____)
# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)
# Select and print categorical columns
categorical_df = df.____(include=['____'])
print(categorical_df.____)