CommencerCommencer gratuitement

Un premier modèle de CTR

Dans cet exercice, vous allez construire un premier modèle de CTR sur le jeu de données Avazu en utilisant un arbre de décision et évaluer la précision du modèle avec accuracy_score() de sklearn. Vous utiliserez également train_test_split() de sklearn pour séparer les données d’entraînement et de test, au lieu de définir manuellement un point de coupure comme précédemment.

Dans votre espace de travail, des données d’exemple sous forme de DataFrame sont chargées dans df, ainsi que sklearn et pandas sous pd.

Nous allons effectuer une séparation simple entraînement/test et évaluer nos résultats à l’aide de la précision.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Instructions

  • Définissez X et y comme les variables explicatives et la cible respectivement, à partir de la colonne click.
  • Séparez les données en ensembles d’entraînement et de test avec train_test_split(X, y).
  • Créez un classificateur par arbre de décision.
  • Générez des prédictions avec ce classificateur et évaluez la précision de ses prédictions.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define X and y 
X = df.____[:, ~df.columns.____(['click'])]
y = df.click

# Define training and testing
X_train, X_test, y_train, y_test = \
	____(____, _____, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = ____()

# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test) 
print(____(y_test, y_pred))
Modifier et exécuter le code