CommencerCommencer gratuitement

Un premier aperçu

En utilisant l’intégralité du jeu de données Avazu, vous allez explorer de nouvelles fonctionnalités en examinant les types de données des colonnes. Les nouvelles données comprennent des colonnes catégorielles telles que site_id, app_id, device_id, etc., qui sont différentes formes d’identifiants pour un site, une application et un utilisateur, respectivement. Pour commencer, vous allez identifier et afficher les colonnes numériques et les colonnes catégorielles.

Des données d’exemple sous forme de DataFrame sont chargées dans df. pandas sous l’alias pd est également disponible dans votre espace de travail.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Instructions

  • Affichez les colonnes de df avec .columns.
  • Affichez les types de données correspondants de df avec .dtypes.
  • Sélectionnez le sous-ensemble de df contenant les colonnes numériques (en utilisant include = ['int', 'float']) et affichez ces colonnes.
  • Sélectionnez le sous-ensemble de df contenant les colonnes catégorielles (en utilisant include = ['object']) et affichez ces colonnes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print columns
print(df.____)

# Print data types of columns
print(df.____)

# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)

# Select and print categorical columns 
categorical_df = df.____(include=['____'])
print(categorical_df.____)
Modifier et exécuter le code